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(54) Hepatitis C Virus 

(57) Das erfindungsgemaBe Hepatitis C Virus 
(HCV) Zellkultursystem besteht aus humanen Hepato- 
mazellen, die mit einem HCV-RNA-Konstrukt transfi- 
ziert sind, das die HCV-spezifischen RNA-Abschnitte 5' 
NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3' NTR und 
zudem wenigstens ein selektierbares Markergen 
(Selektionsgen) umfaBt. 
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[0001] Die Erfindung betrifft ein Hepatitis C Virus (HCV) Zellkultursystem, das im wesentlichen eukaryontische Zel- 
len umfaGt, die eingeschleustes HCV-spezifisches Genmaterial enthalten, d.h. die mit HCV-spezifischem Genmaterial 
5 transfiziert sind. 

[0002] Das Hepatitis C Virus (HCV) ist eine der Hauptursachen chronischer und sporadischer Leberkrankungen 
weltweit. Die meisten HCV-lnfektionen verlaufen ohne erkennbare klinische Symptome, allerdings werden 80-90% der 
Infizierten dauerhafte Virustrager und bei 50% dieser dauerhaften Virustrager kommt es zu einer chronischen Leber- 
entzundung mit unterschiedlichen Schweregraden. Ca. 20% der chronisch Infizierten entwickeln im Laufevon 10 bis 20 

10 Jahren eine Leberzirrhose, auf deren Basis sich ein primares Leberzellkarzinom entwickeln kann. Die chronische 
Hepatitis C ist heute die Hauptindikation fur eine Lebertransplantation. Eine Kausaltherapie gibt es bisher noch nicht. 
Die einzige derzeit verfugbare Therapie ist die hochdosierte Verabreichung von Interferon-Alpha Oder eine Kombination 
aus Interferon-Alpha und dem Purin-Nukleosidanalogon Ribavirin. Allerdings sprechen nur ca. 60 % aller Behandelten 
auf diese Therapie an und bei diesen kommt es in mehr als der Halfte aller Falle nach dem Absetzen der Behandlung 

15 zu einer erneuten Viramie. 

Aufgrund der hohen Pravalenz, gerade auch in den Industrielandern, den schwerwiegenden Folgen chronischer Infek- 
tionen und dem Fehlen einer Kausaltherapie ist die Entwicklung einer HCV-spezifischen Chemotherapie ein wesentli- 
ches Ziel der pharmazeutischen Forschung und Entwicklung. Hauptproblem hierbei ist bisher das Fehlen eines 
geeigneten Zellkultursystems, das ein Studium der Virus-Replikation und der Pathogenese in eukaryontischen Zellen 

20 ermoglicht. 

[0003] Aufgrund der geringen Virusmengen im Blut bzw. Gewebe, dem Fehlen geeigneter Zellkultursysteme oder 
Tiermodelle (bis heute ist der Schimpanse das einzige mogliche Versuchstier) sowie dem Fehlen effizienter Systeme 
zur Produktion virus-ahnlicher Partikel, konnte die molekulare Zusammensetzung des HCV-Partikels bis heute noch 
nicht eingehend untersucht bzw. aufgeklart werden. Die derzeit vorliegenden Ergebnisse lassen sich wie folgt zusam- 

25 menfassen: Das HCV ist ein umhulltes Plusstrang RNA Virus mit einem Partikeldurchmesser von 50-60 nm und einer 
mittleren Dichte von 1,03-1, 1g/ml. Es wurde erstmals 1989 molekular kloniert und charakterisiert (Choo et al., 1989: 
Science, 244, 359-362). Die HCV- RNA hat eine Lange von ca. 9.6 kb (= 9600 Nukleotide), eine positive Polaritat und 
besitzt ein einziges offenes Leseraster (ORF = open reading frame), das ein lineares Polyprotein von ca 3010 Amino- 
sauren kodiert (siehe Rice 1996, in Virology, B. N. Fields, D. M. Knipe, P. M. Howley, Eds. (Lippincott-Raven, Philadel- 

30 phia, PA, 1996), vol. 1, pp.931 -960; Clarke 1997, J. Gen. Virol. 78, 2397; und Bartenschlager 1997, Intervirology 40, 
378 und vgl. Fig. 1 A). Bei der Virusreplikation wird das Polyprotein durch zellulare und virale Proteasen in die reifen 
und funktionell aktiven Proteine gespalten. 

Innerhalb des Polyproteins sind die Proteine wie folgt angeordnet (vom Amino- zum Carboxyterminus): Core-E1 -E2-p7- 
NS2-NS3-NS4A-NS4B-NS5A-NS5B. Das Core-Protein ist die Hauptkomponente des NuWeokapsids. Die Glykoprote- 

35 ine E1 und E2 sind Transmembranproteine und Hauptkomponenten der Virushulle. Sie spielen wahrscheinlich bei der 
Anheftung des Virus an die Wirtszelle eine wesentliche Rolle. Diese drei Proteine Core, E1 und E2 bauen den Virus- 
partikel auf und werden deshalb als Strukturproteine bezeichnet. Die Funktion des Proteins p7 ist noch unklar. Das Pro- 
tein NS2 ist wahrscheinlich die katalytische Domane der NS2-3 Protease, die fur die Prozesierung zwischen den 
Proteinen NS2 und NS3 verantwortlich ist. Das Protein NS3 hat zwei Funktionen, namlich in der aminoterminalen 

40 Domane eine Proteaseaktivitat, die fur die Polyproteinprozessierung essentiell ist, und in der carboxyterminalen 
Domane eine NTPase/Helikase-Funktion, die wahrscheinlich bei der Replikation der viralen RNA eine Rolle spielt. Das 
Protein NS4A ist ein Kofaktorder NS3-Protease. Die Funktion des Proteins NS4B ist unbekannt. 
[0004] Das offene Leseraster ist an seinem 5' Ende von einer ca 340 Nukleotide langen nicht-translatierten Region 
(NTR = non-translated region) flankiert, die als interne Ribosomenansatzstelle (IRES = internal ribosome entry site) 

45 fungiert, und an seinem 3' Ende von einer ca. 230 Nukleotide langen NTR, die hochstwahrscheinlich filr die Genomre- 
plikation von Bedeutung ist. Eine solche 3' NTR ist Gegenstand der Patentanmeldung PCT/US 96/14033. Die Struktur- 
proteine in dem amino-terminalen Viertel des Polyproteins werden von der Signalpeptidase der Wirtszelle gespalten. 
Die Nicht-Strukturproteine (NS) 2 bis (NS) 5B werden von zwei viralen Enzymen prozessiert, namlich von der NS2-3 
und der NS3/4A Proteinase. Die NS3/4A Proteinase wird fur alle Spaltungen jenseits des Carboxyterminus von NS3 

so benotigt. Die Rolle von NS4B ist nicht bekannt. NS5A, ein hoch phosphoryliertes Protein, scheint fur die Interferon 
Resistenz verschiedener HCV-Genotypen verantwortlich zu sein (vgl. Enomoto et al. 1995, J. Clin. Invest. 96, 224; 
Enomoto et al. 1996, N. Engl. J. Med. 334, 77; Gale Jr. et al. 1997, Virology 230, 217; Kaneko et al. 1994, Biochem. 
Biophys. Res. Commun. 205, 320; Reed et al., 1997, J. Virol. 71, 7187) und NS5B wurde als die RNA-abhangige RNA 
Polymerase identifiziert. 

55 [0005] Anhand dieser Erkenntnisse wurden erste Diagnosesysteme entwickelt, die entweder auf dem Nachweis 
von HCV-spezifischen Antikorpern in Patientenserum oder auf dem Nachweis von HCV-spezifischer RNA mittels RT- 
PCR (= Reverse Transcription Polymerase Chain Reaction) beruhen, und die mittlerweile routine- und/oder vorschrifts- 
maBig bei alien Blutkonserven angewendet werden (mussen). 
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[0006] Seit der Erstbeschreibung des Genoms 1 989 wurden mit Hilfe der PCR-Methode zahlreiche Teil- und Kom- 
plettsequenzen des HCV kloniert und charakterisiert. Ein Vergleich dieser Sequenzen zeigt eine hohe Variabilitat des 
viralen Genoms, insbesondere im Bereich des NS5B-Gens, was letztendlich zu einer Einteilung in 6 Genotypen gefCihrt 
hat, die selbst nochmals in Subtypen a, b, und c untergliedert sind. Die genomische Varianz ist nicht gleichmaBig iiber 
das Genom verteilt. So sind die 5'NTR und Teile der 3'NTR hoch konserviert, wahrend bestimmte kodierende Sequen- 
zen z.T. sehr stark variieren, vor allem die Hullproteine E1 und E2. 

[0007] Die Wonierten und charakterisierten Teil- und Komplettsequenzen des HCV-Genoms wurden auBerdem hin- 
sichtlich geeigneter Angriffsziele fur ein prospektives arrtivirales Therapeutikum untersucht. Dabei wurden drei virale 
Enzyme gefunden, die sich als solches Angriffsziel anbieten. Diese sind (1) der NS3/4A Proteasekomplex, (2) die NS3 
Helikase und (3) die NS5B RNA-abhangige RNA Polymerase. Der NS3/4A Proteasekomplex und die NS3 Helikase 
konnten bereits kristallisiert und hinsichtlich ihrer dreidimensionalen Struktur aufgeWart werden (Kim et al., 1996, Cell, 
87,343; Yem et al., 1998, Protein Science, 7, 837; Love et al., 1996, Cell, 87, 31 1 ; Kim et al., 1998, Structure, 6, 89; Yao 
et al., 1997, Nature Structural Biology, 4, 463, Cho et al.„ 1998, J. Biol. Chem., 273, 15045); bei der NS5B RNA-abhan- 
gigen RNA Polymerase ist dies bis heute noch nicht gelungen. 

Obwohl mit diesen Enzymen bedeutsame Angriffsziele fur eine TherapieentwicWung der chronischen HCV-lnfektion 
definiert sind, und obwohl sowohl mit Hilfe von 'rational drug design' als auch mit Hilfe von 'high throughput screens' 
weltweit intensiv nach geeigneten Inhibitoren gesucht wird, leidet die TherapieentwicWung an einem groBen Defizit, 
namlich dem Fehlen von Zellkultursystemen oder einfachen Tiermodellen, die es erlauben, HCV-RNA oder HCV-Anti- 
gene direkt, zuverlassig und mit einfachen laborublichen Methoden nachzuweisen. Das Fehlen soldier Zellkultursy- 
steme ist auch der Hauptgrund dafur, daB das Verstandnis der HCV-Replikation bis heute noch sehr luckenhaft und in 
weiten Teilen nur hypothetisch ist. 

[0008] Obwohl nach Meinung der Fachwelt eine enge evolutionare Beziehung zwischen HCV und den Flavi- und 
Pestiviren besteht und fur diese autonom replizierende RNAs beschrieben sind, die in verschiedenen Zellinien ohne 
weiteres zur Replikation gebracht werden konnen und dabei relativ hohe Ausbeuten zeigen ( siehe Khromykh et al., 
1997, J. Virol. 71, 1497; Behrens et al„ 1998, J.Virol. 72, 2364; Moser et al., 1998, J. Virol. 72, 5318), waren ahnliche 
Versuche mit HCV bisher nicht erfolgreich. 

[0009] Zwar ist aus verschiedenen Publikationen bekannt, daB Zellinien oder primare Zellkulturen mit HCV-halti- 
gem, hochtitrigem Patientenserum infiziert werden konnen, (Lanford etal. 1994, Virology 202, 606; Shimizuetal. 1993, 
Procedings of the National Academy of Sciences, USA, 90, 6037-6041; Mizutani et al. 1996, Journal of Virology, 70, 
7219-7223; M. Ikedaetal. 1998, Virus Res. 56, 157; Fournieretal. 1998, J. Gen. Virol. 79, 2376 unddarin zitierte Lite- 
raturstellen, Ito et al. 1996, Journal of General Virology, 77, 1043-1054), diese virusinfizierten Zellinien oder Zellkultu- 
ren erlauben jedoch nicht den direkten Nachweis von HCV-RNA oder HCV-Antigenen. Die virale RNA in diesen Zellen 
ist weder in einem Nothern-Blot (einem Standardverfahren zum quantitativen Nachweis von RNA) noch sind die viralen 
Protein in einem Western-Blot oder mittels Immunprazipitation detektierbar. Nur mit sehr aufwendigen und indirekten 
Methoden ist es iiberhaupt gelungen, eine HCV-Replikation nachzuweisen. Diese nachteiligen Umstande zeigen War, 
dal3 die Replikation in diesen bekannten virusinfizierten Zellinien oder Zellkulturen absolut unzureichend ist. 
[0010] Desweiteren ist aus den Publikationen von Yoo etal. (1995, Journal of Virology, 69, 32-38) und von Dash et 
al., (1997, American Journal of Pathology, 151, 363-373) bekannt, daB Hepatomazellinien mit synthetischer HCV-RNA, 
die mittels in vitro Trankription von Woniertem HCV-Genom gewonnen wurde, transfiziert werden konnen. In beiden 
Publikationen gingen die Autoren von dem Grundgedanken aus, dal3 das virale HCV-Genom eine Plusstrang-RNA ist, 
die nach dem Einschleusen in die Zelle direkt als mRNA fungiert, an die sich Ribosomen anheften und im Zuge von 
Translationsprozessen Virusproteine bilden, aus denen sich letztendlich neue HCV-Partikel bilden (konnen). Diese 
Virusreplikation, d.h. diese neu gebildeten HCV-Viren bzw. deren RNA wurde mittels RT-PCR nachgewiesen. Die publi- 
zierten Ergebnisse der durchgefuhrten RT-PCR sprechen jedoch dafur, daB die Effizienz der HCV-Replikation in den 
beschriebenen HCV-transfizierten Hepatomazellen nur sehr gering ist und jedenfalls nicht ausreicht, urn Schwankun- 
gen in der Replikationsrate nach gezielter Einwirkung mit prospektiven antiviralen Therapeutika auch nur qualitativ, 
geschweige denn quantitativ zu messen. AuBerdem ist im Stand der Technik mittlerweile bekannt (Yanagi et al., Proc. 
Natl. Acad. Sci. USA, 96, 2291-95, 1999), daB die hochkonservierte 3' NTR essentiell ist fur die Virusreplikation, was 
in klarem Widerspruch zu den Behauptungen von Yoo et al. und Dash et al. steht, die fur ihre Versuche in Unkenntnis 
des authentischen 3' Endes des HCV-Genoms ausschlieBlich HCV-Genome mit verkiirzten 3' NTRs verwendet haben. 
[0011] Aufgabe der vorliegenden Erfindung ist die Bereitstellung eines HCV- Zellkultursystems, bei dem die virale 
RNA in den transfizierten Zellen autonom und mit so hoher Effizienz repliziert, daB Schwankungen in der Replikations- 
rate nach gezielter Einwirkung mit virus- und insbesondere HCV-spezifischen prospektiven antiviralen Therapeutika 
qualitativ und quantitativ und mit Hilfe gangiger, laborublicher MeBverfahren gemessen werden konnen. 
[0012] Eine Losung dieser Aufgabe besteht in der Bereitstellung eines Zellkultursystems der eingangs genannten 
Art, bei dem die eukaryontischen Zellen humane Zellen, insbesondere Hepatomazellen sind, die vorzugsweise von 
einer handelsublichen Hepatomazellinie abstammen, aber auch aus einer entsprechenden Primarzellkultur gewonnen 
sein konnen, und bei dem das eingeschleuste HCV-spezifische Genmaterial ein HCV-RNA-KonstruW ist, das im 
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wesentlichen die HCV-spezifischen RNA-Abschnitte 5' NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3' NTR, vorzugs- 
weise in der genannten Reihenfolge, und zudem wenigstens ein selektierbares Markergen (Selektionsgen) umfaBt. 
"NTR" steht hier und im folgenden fur "nicht-translatierte Region" und ist dem einschlagigen Fachmann als Begriff bzw. 
Abkurzung bekannt und gelaufig. Der Begriff "HCV-RNA-Konstrukt" umfaBt hier und im folgenden sowohl Konstrukte, 
5 die das komplette HCV-Genom enthalten, als auch solche, die lediglich einen Teil davon, d.h. ein HCV-Subgenom ent- 
halten. 

Eine bevorzugte Variante des erfindungsgemaBen Zellkultursystems, die sich in der Praxis sehr gut bewahrt hat, ist 
unterder Nummer DSM ACC2394 (Laborbezeichnung HuBI 9-13) bei der DSMZ, Deutsche Sammlung von Mikroorga- 
nismen und Zellkulturen GmbH in Braunschweig, Deutschland, hinterlegt. 

10 [001 3] Mit dem erfindungsgemaBen Zellkultursystem wird erstmals ein in-vitro-System bereit gestellt, in dem HCV- 
RNA intrazellular, autonom und in ausreichend groGen Mengen repliziert und exprimiert wird, so daB eine quantitative 
Bestimmung sowohl der HCV-RNA-Mengen als auch der HCV-spezifischen Proteine mit konventionellen und zuverlas- 
sig genauen biochemischen MeBmethoden durchgefuhrt werden kann. Das heiBt: es steht erstmals ein annahernd 
authentisches zellgestiitztes ("cell-based") HCV-Replikationssystem zur VerfLigung, das fur die Entwicklung und Erpro- 

15 bung von antiviralen Pharmazeutika dringend benotigt wird. Dieses Testsystem bietet nun die Moglichkeit, potentielle 
Angriffsziele fur eine wirksame HCV-spezif ische Therapie zu identif izieren und HCV-spezif ische Chemotherapeutika zu 
entwickeln und zu evaluieren. 

[0014] Die Erfindung basiert auf der uberraschenden Erkenntnis, daR eine effiziente Replikation der HCV-RNA nur 
dann in Zellen stattfindet, wenn diese mit einem HCV-RNA-Konstrukt transfiziert wurden, das mindestens die 5' und die 

20 3' nicht-translatierten Regionen (NTR) und die Nichtstrukturproteine (NS) 3 bis 5B umfaBt und zusatzlich ein selektier- 
bares Markergen (Selektionsgen) aufweist. Offensichtlich sind die Strukturgene fur den Ablaut der Replikation ohne 
wesentliche Bedeutung, wahrend andererseits eine effiziente Replikation der HCV-RNA anscheinend nur dann stattfin- 
det, wenn die transfizierten Zellen einem permanenten Selektionsdruck unterzogen werden, der durch das mit der 
HCV-RNA verbundene selektierbare Markergen (Selektionsgen) vermittelt wird. Das Markergen (Selektionsgen) 

25 scheint somit einerseits die Selektion derjenigen Zellen zu provozieren, in denen die HCV-RNA produktiv repliziert, und 
andererseits scheint es die Effizienz der RNA-Replikation weserrtlich zu steigern. 

[0015] Gegenstand der Erfindung ist auch ein zellfreies HCV-RNA-Konstrukt, das sich dadurch auszeichnet, daR 
es die HCV-spezifischen RNA-Abschnitte 5' NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3' NTR, vorzugsweise in der 
genannten Reihenfolge, und zudem ein selektierbares Markergen (Selektionsgen) umfaRt. 
so [0016] Der Begriff 5' NTR bzw. NS3 bzw. NS4A bzw NS4B bzw NS5A bzw NS5B bzw. 3' NTR umfaBt im vorlie- 
genden Zusammenhang jede Nukleotidsequenz, die im Stand der Technik als Nukleotidsequenz fur den jeweils betref- 
fenden funktionellen Abschnittdes HCV-Genoms beschrieben ist. 

[0017] Die Bereitstellung eines solchen HCV-RNA-Konstrukts ermoglicht erstmals eine detaillierte Analyse der 
HCV - Replikation, - Pathogenesis und - Evolution in Zellkulturen. Die HCV-spezifische virale RNA kann - als vollstan- 
35 diges Genom Oder als Subgenom - gezielt in beliebigen Mengen erzeugt werden, und es besteht die Moglichkeit, das 
RNA-Konstrukt zu manipulieren und damit die HCV-Funktionen auf genetischer Ebene zu untersuchen und aufzuWa- 
ren. 

[0018] Da alle zur Zeit als Hauptangriffsziel fur eine Therapie untersuchten HCV-Enzyme, namlich die NS3/4A Pro- 
tease, die NS3 Helikase und die NS5B Polymerase, in dem erfindungsgemaBen HCV-RNA-Konstrukt enthalten sind, 

40 kann es fur alle entsprechenden Untersuchungen benutzt werden. 

[001 9] Eine Ausfuhrungsform des HCV-RNA-Konstrukts, die sich in der praktischen Anwendung sehr gut bewahrt 
hat, zeichnet sich dadurch aus, daR sie die Nukleotidsequenz gemaR Sequenzprotokoll SEQ ID NO:1 umfaBt. 
Weitere Ausfuhrungsvarianten mit vergleichbar guten Eigenschaften fur den Einsatz in der Praxis sind dadurch 
gekennzeichnet, daB sie eine Nukleotidsequenz entweder gemaR Sequenzprotokoll SEQ ID NO:2 oder SEQ ID NO:3 

45 oder SEQ ID NO:4 oder SEQ ID NO:5 oder SEQ ID NO:6 oder SEQ ID NO:7 oder SEQ ID NO:8 oder SEQ ID NO:9 
Oder SEQ ID NO:10 oder SEQ ID NO:1 1 umfassen. 

[0020] Es besteht die Moglichkeit, das erfindungsgemaRe HCV-Subgenom-Konstrukt mit einer 3' NTR zu verse- 
hen, die eine im Stand der Technik hierfur bisher unbekannte Nukleotidsequenz aufweist, namlich eine Nukleotidse- 
quenz, die aus der Gruppe der nachfolgend aufgelisteten Nukleotidsequenzen (a) bis (i) ausgewahlt ist: 

50 



55 
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(a) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTTTTTTTA 
GCTTTTTTTTTTTTCTTTTTTTTTGAGAGAGAGAGTCTCACTCTGTTGCCC 
AGACTGGAGT 

(b) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GGAGC 

(c) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT CTCACTCTGT 
TGCCCAGACT GCAGC 

(d) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAGTC TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG AGTCTCACTC 
TGTTGCCCAG ACTGGAGT 



(e) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG AGTCTCACTC 
TGTTGCCCAG ACTGGAGT 

(f) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 

3 o TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TTGAGAGAGA GAGTCTCACT 

CTGTTGCCCA GACTGGAGT 

(g) ACCKXKjAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
35 TTTTTAGTCT TTTTTTTTTT CTTTTTTTTT GAGAGAGAGA 

GTCTCACTCT GTTGCCCAGA CTGGAGT 

(h) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
40 TTTTTTTAAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 

GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T 

(i) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
4 5 TTTTTTAATC TTTTTTTTTT TTTTCTTTTT TTTTTGAGAG 

AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT 



Das in den erfindungsgemaBen HCV-RNA-Konstrukten enthaltene selektierbare Markergen (Selektionsgen) ist vor- 

50 zugsweise ein Resistenzgen, insbesondere eine Antibiotikumresistenzgen. 

Das hat den Vorteil, daB die mit diesem Konstrukt transfizierten Zellen leicht von den nicht transfizierten Zellen selek- 
tiert werden konnen, indem dem Zellkulturmedium z.B. im Fall eines Antibiotikumresistenzgens das betreffende Anti- 
biotikum zugegeben wird. Unter Antibiotikum' wird im vorliegenden Zusammenhang jede Substanz verstanden, die die 
nicht-transfizierten Wirtszellen oder die Zellen, in denen die HCV-RNA nur mit geringer Effizienz repliziert, am Leben 

55 Oder Wachstum hindert, insbesondere Zellgifte wie z.B. Puromycin, Hygromycin, Zeocin, Bleomycin oder Blasticidin. 
[0021] Ein bevorzugtes selektierbares Markergen (Selektionsgen) bzw. Resistenzgen, das sich in der Praxis sehr 
gut bewahrt hat, ist das Neomycinphosphotransferasegen. 

[0022] Eine Alternative zu den Antibiotikumresistenzgenen ist z.B. das Thymidin-Kinase-Gen, mit dem eine HAT- 
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Selektion durchgefuhrt werden kann. 

[0023] Die Position des selektierbaren Markergens (Selektionsgens), bzw. des bevorzugten Resistenzgens bzw. 
des besonders bevorzugten Antibiotikumresistenzgens in dem HCV-RNA-Konstrukt liegt vorzugsweise hinter der HCV 
5' NTR, d.h. strangabwarts der 5' NTR bzw. strangaufwarts des HCV-Leserasters. Denkbar ist aber auch eine Insertion 

5 im Bereich der 3' NTR oder an anderer Stelle des HCV-Genoms Oder -Subgenoms, z.B. innerhalb des Polyproteins. 
[0024] Bei einer alternativen Ausfuhrungsform des erfindungsgemaBen HCV-RNA-Konstrukts ist das selektierbare 
Markergen (Selektionsgen), insbesondere ein Antibiotikumresistenzgen, uber ein Ribozym bzw. eine Erkennungsstelle 
fur ein Ribozym mit der HCV-RNA bzw. der HCV-Genom- oder -Subgenomsequenz verbunden. 
[0025] Damit geht der Vorteil einher, daB nach erfolgter Selektion derjenigen Zellen, in denen die HCV-RNA pro- 

10 duktiv repliziert, in den daraus gewonnenen Zellklonen das Resistenzgen durch ribozymvermittelte Spaltung von der 
HCV-Subgenomsequenz abgetrennt werden kann, namlich durch Aktiviei ung des einklonierten Ribozyms oder, im Fall 
eines Konstrukts mit einer Erkennungsstelle fur ein Ribozym, durch Einschleusen des Ribozyms in die Zellen (z.B. mit- 
tels Transfektion eines Ribozymkonstrukts oder Infektion mit einem viralen Expressionsvektor, in den das entspre- 
chende Ribozym eingesetzt wurde). Auf diese Weise wird ein authentisches HCV-Genom-Konstrukt ohne 

15 Resistenzgen erhalten, das zur Bildung authentischer infektioser Viruspartikel befahigt ist. 

[0026] Eine weitere bevorzugte Ausfuhrungsform des erfindungsgemaBen HCV-RNA-Konstrukts zeichnet sich 
dadurch aus, daB das Konstrukt wenigstens ein integriertes Reportergen aufweist. 

[0027] Unter Reportergen wird im folgenden jedes Gen verstanden, dessen Anwesenheit sich nach Uberfuhrung 
in einen Zielorganismus leicht und im allgemeinen mit einfachen biochemischen oder auch histochemischen Methoden 
20 nachweisen laBt, d.h. das fur ein Protein kodiert, welches auch in geringen Mengen einfach und zuverlassig mit den 
laboriiblichen MeBmethoden nachgewiesen und quantifiziert werden kann. 

[0028] Diese Variante des HCV-RNA-Konstrukts hat den Vorteil, daB der Umfang der Replikation dieses Konstrukts 

anhand des Reportergenprodukts einfach und schnell mit laboriiblichen Methoden gemessen werden kann. 

[0029] Das Reportergen ist vorzugsweise ein Gen aus der Gruppe der Luziferasegene, dem CAT-Gen (Chloram- 

25 phenicol-Acetyl-Transferase-Gen), dem lacZ-Gen (beta-Galaktosidasegen), dem GFP-Gen (green-fluorescence-pro- 
tein-Gen ), dem GUS-Gen (Glukuronidasegen) oder dem SEAP-Gen (Sezernerte-Alkalische-Phosphatase-Gen). 
Diese Reportergene bzw. deren Produkte, namlich die entsprechenden Reporterproteine, konnen z.B. mittels Fluores- 
zenz, Chemilumineszenz, colorimetrisch oder mit Hilfe immunologischer Methoden (z.B. ELISA) bestimmt werden. 
[0030] Als Reportergen kommt aber auch ein Surrogatmarkergen in Betracht. Darunter sind in diesem Zusammen- 

30 hang solche Gene zu verstehen, die fur zellulare Proteine, NuWeinsauren oder — allgemein —fur solche Funktionen 
kodieren, die einer von der Virusreplikation abhangigen Variation unterliegen, und die infolgedessen in denjenigen Zel- 
len, in denen sich das HCV bzw. das HCV-RNA-Konstrukt vermehrt, entweder reprimiert oder aktiviert werden. Das 
heiBt: die Reduktion bzw. Aktivierung dieser Funktion ist ein Ersatzmarker fur die Virusreplikation bzw. die Replikation 
des HCV-RNA-Konstrukts. 

35 [0031] Die Positionen von Reportergen und selektierbarem Markergen (Selektionsgen) konnen so gewahlt sein, 
daB ein aus den beiden Genprodukten gebildetes Fusionsprotein exprimiert wird. Hierbei besteht die vorteilhafte Mog- 
lichkeit, daB diese beiden Gene so in dem HCV-RNA-Konstrukt angeordnet sind, daB ihre beiden exprimierten Proteine 
zunachst uber eine Schnittstelle fur eine Protease (z.B. Ubiquitin) oder uber ein selbstspaltendes Peptid (z.B. das 2A- 
Protein der Picornaviren) fusioniert sind und erst spater proteolytisch wieder getrennt werden. 

40 Ebensogut konnen diese beiden Positionen aber auch derart getrennt voneinander liegen, daB beide Genprodukte 
separat exprimiert werden. (z.B. in der Reihenfolge: Marker- bzw. Resistenzgen — interne Ribosomenbindungsstelle 
— Reportergen). 

Im Fall des Reportergens hat sich eine Ausfuhrungsvariante besonders bewahrt, bei der das Reportergen in das offene 
Leseraster des HCV-Genoms oder -Subgenoms einkloniert ist, und zwar derart, daB es erst nach einer proteolytischen 
45 Prozessierung in eine aktive Form uberfuhrt wird. 

[0032] Das erfindungsgema.Be Zellkultursystem in alien seinen Variationen kann fur vielfaltige Zwecke eingesetzt 
werden. Diese umfassen: 

• Das Auffinden antiviral wirksamer Substanzen. Dies konnen beispielsweise sein: organische Verbindungen, die 
so unmittelbar oder mittelbar in die Virusvermehrung eingreifen (z.B. Inhibitoren der viralen Proteasen, der NS3-Heli- 
kase, der NS5B RNA-abhangigen RNA Polymerase), antisense Oligonukleotide, die an eine beliebige Zielsequenz 
innerhalb des HCV-RNA-Konstrukts (z.B. die 5' NTR) hybridisieren und unmittelbar oder mittelbar zu einer Beein- 
flussung der Virusvermehrung fuhren z.B. auf Grund einer Reduktion der Translation des HCV-Polyproteins oder 
Ribozyme, die eine beliebige HCV-RNA-Sequenz spalten und damit die Virusreplikation beeintrachtigen. 
55 • Die Evaluierung jeglicher Art antiviral wirksamer Substanzen in Zellkultur. Solche Substanzen konnen beispiels- 
weise mittels 'rational drug design' oder 'high-throughput screening' am isolierten gereinigten Enzym gefunden 
werden. Unter Evaluierung sind vor allem die Bestimmung der inhibitorischen Eigenschaften der entsprechenden 
Substanz sowie deren Wirkungsmechanismus zu verstehen. 
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Die Identifikation neuer Angriffsziele, viralen oder zellularen Ursprungs, fur eine HCV-spezifische antivirale Thera- 
pie. 1st beispielsweise ein zellulares Protein essentiell fur die Virusreplikation, kann mittels Hemmung dieses zellu- 
laren Proteins die Virusreplikation ebenfalls beeinfluGt werden. Das Auffinden solcher auxiliaren Faktoren ist mit 
dem erfindungsgemaGen System ebenfalls mdglich. 

5 • Der Einsatz fur die Resistenzbestimmung, Es ist anzunehmen, daG auf Grund der hohen Mutationsrate des HCV- 
Genoms Therapieresistenzen auftreten. Solche Resistenzen, die gerade bei der Winischen Zulassung einer Sub- 
stanz von groGer Bedeutung sind, lassen sich mit dem erfindungsgemaGen Zellkultursystem ermitteln. Zellinien in 
denen sich das HCV-RNA-Konstrukt bzw. das HCV-Genom oder - Subgenom repliziert, werden mit steigenden 
Konzentrationen der entsprechenden Substanz inkubiert und die Replikation der viralen RNA wird entweder 

10 anhand eines eingebrachten Reporters oder durch qualitative oder quantitative Bestimmung der viralen Nuklein- 
sauren oder Proteine bestimmt. Resistenz ist dann gegeben, wenn bei normaler Wirkstoffkonzentration keine 
Hemmung der Replikation zu beobachten ist. Durch ReWonierung der HCV-RNA (z.B. mittels RT-PCR) und 
Sequenzanalyse kdnnen die fur Therapieresistenz verantwortlichen NuWeotid- bzw. Aminosaureaustausche ermit- 
telt werden. Durch Einklonieren der/des entsprechenden Austausche/s in das Ursprungskonstrukt kann deren 

15 Kausalitat fur die Therapieresistenz bewiesen werden. 

• Die Produktion von authentischen Virusproteinen (Antigene) fur die Entwicklung und/oder Evaluierung von Diagno- 
stika. Das erfindungsgemalBe Zellkultursystem erlaubt auch die Expression von HCV-Antigenen in Zellkulturen. 
Diese Antigene konnen prinzipiell auch fur den Aufbau diagnostischer Nachweisverfahren eingesetzt werden. 

• Die Produktion von HCV Viren und virus-ahnlichen Partikeln insbesondere zur Entwicklung oder Herstellung von 
20 Therapeutika und Impfstoffen sowie fur diagnostische Zwecke. Insbesondere zellkultur-adaptierte vollstandige 

HCV-Genome, die mit dem erfindungsgemaGen Zellkultursystem hergestel It werden konnen, sind in der Lage, mit 
hoher Effizienz in Zellkulturen zu replizieren. Diese Genome besitzen alle Funktionen des HCV und sind deshalb 
in der Lage infektiose Viren zu produzieren. 

25 [0033] Das erfindungsgemaGe HCV-RNA-Konstrukt fur sich genommen kann in alien seinen Variationen ebenfalls 
fur vielfaltige Zwecke eingesetzt werden. Dazu gehoren vor allem: 

• Die Konstruktion attenuierter Hepatitis C Viren bzw. HCV-ahnlicher Partikel und deren Produktion in Zellkulturen: 
Durch zufallige oder gezielt hervorgerufene Mutationen, beispielsweise Punktmutationen, Deletionen oder Insertio- 

30 nen, konnen attenuierte HCV- oder HCV-ahnliche Partikel erzeugt werden, d.h. Viren bzw. virusahnliche Partikel 
mit voller Replikationskompetenz aber verringerter bzw. fehlender Pathogenitat. Solche attenuierte HCV- oder 
HCV-ahnliche Partikel sind insbesondere als Impfstoff einsetzbar. 

• Die Konstruktion von HCV-RNA-Konstrukten mit integrierten Fremdgenen, beispielsweise zur Verwendung als 
leberzellspezifische Genfahren in der Gentherapie. Auf Grund des ausgepragten Leberzelltropismus des HCV und 

35 der Moglichkeit, Teile des Genoms durch heterologe Sequenzen zu ersetzen, lassen sich HCV-RNA-Konstrukte 
herstellen, bei denen beispielsweise die Strukturproteine durch ein therapeutisch wirksames Gen ersetzt werden. 
Das so erhaltene HCV-RNA-Konstrukt wird in Zellen eingeschleust, vorzugsweise mittels Transfektion, die die feh- 
lenden HCV-Funktionen, beispielsweise die Struturproteine, konstitutiv oder induzierbar exprimieren. Durch diese 
dem Fachmann unter dem Begriff der Transkomplementation' bekannte Technik lassen sich Viruspartikel erzeu- 

40 gen, in die das HCV-RNA-Konstrukt eingebaut wird. Die so erhaltenen Partikel konnen fur die Infektion vorzugs- 
weise von Leberzellen verwendet werden. In diesen wird das therapeutisch wirksame Fremdgen zur Expression 
gebracht und entfaltet damit seine therapeutische Wirkung. 

Das Auffinden permissiver Zellen, d.h. Zellen, in denen eine produktive Virusvermehrung erfolgt. Zu diesem Zweck 
wird entweder eines der vorgenannten HCV-RNA-Genomkonstrukte verwendet, das zur Bildung kompletter infek- 

45 tioser Viren befahigt ist, oder es wird eines der vorgenannten HCV-Subgenom-Konstrukte eingesetzt, das aller- 
dings zunachst gemaG vorgenanntem Beispiel in eine Zellinie transfiziert wird, die die fehlenden Funktionen 
konstitutiv oder induzierbar exprimiert. In all diesen Fallen entstehen Viruspartikel, die zusatzlich zur HCV- 
Sequenz ein Resistenz- und/oder Reportergen tragen. Zum Auffinden von Zellen, in denen das HCV replizieren 
kann, werden diese Zellen mit den so hergestellten Viren infiziert und einer Antibiotikumselektion unterzogen oder, 

so in Abhangigkeit vom HCV-RNA-Konstrukt, mittels Nachweis der Expression des Reportergens untersucht. Da eine 
Antibiotikumresistenz bzw. eine Expression des Reportergens nur dann nachweisbar ist, wenn das HCV-RNA-Kon- 
strukt repliziert, mussen die so gefundenen Zellen permissiv sein. Auf diese Weise lassen sich nahezu beliebige 
Zellinien oder primare Zellkulturen hinsichtlich der Permissivitat testen und auffinden. 

55 [0034] Das erfindungsgemaGe Zellkultursystem erlaubt auch das gezielte Auffinden von HCV-RNA-Konstrukten, 
bei denen es auf Grund von Mutationen, die sich entweder zufallig im Rahmen der HCV-RNA-Replikation ereignen 
oder die gezielt in das Konstrukt eingefuhrt werden, zu einer Steigerung der Replikationseff izienz kommt. Solche Muta- 
tionen, die zu einer Veranderung der Replikation des HCV-RNA- Konstrukts fuhren, sind dem Fachmann als adaptive 
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Mutationen bekannt. Die Erfindung umfaBtdeshalb auch Verfahren zur Gewinnung von zellkultur-adaptierten Mutanten 
eines erfindungsgemaBen HCV-RNA-Konstrukts gemaB vorstehender Beschreibung, wobei die Mutanten gegenuber 
dem originaren HCV-RNA-Konstrukt eine erhohte Replikationseffizienz aufweisen. Sie umfaBt desweiteren ein Verfah- 
ren zur Herstellung von Mutanten eines HCV-RNA-Vollangengenoms Oder eines HCV-RNA-Teilgenoms Oder eines 
5 beliebigen HCV-RNA-Konstrukts mit im Vergleich zu dem ursprunglichen HCV-RNA-Vollangengenom Oder -Teilgenom 
Oder HCV-RNA-Konstrukt erhohter Replikationseffizienz, sowie zellkultur-adaptierte Mutanten von HCV-RNA-Kon- 
strukten, HCV-Vollangengenomen und HCV-Teilgenomen mit im Vergleich zu den ursprunglichen Konstrukten, Teil- 
oder Vollangengenomen erhohter Replikationseffizienz. 

[0035] Das erfindungsgemaBe Verfahren zur Gewinnung von zellkultur-adaptierten Mutanten eines erfindungs- 
10 gemaBen HCV-RNA-Konstrukts, wobei die Mutanten gegenuber dem HCV-RNA-Konstrukt eine erhohte Replikations- 
effizienz aufweisen, ist dadurch gekennzeichnet, daB man ein Zellkultursystem gemaB Anspruch 1, bei dem das 
eingeschleuste HCV-spezifische Genmaterial ein HCV-RNA-Konstrukt mit Selektionsgen nach einem der AnsprCiche 4 
bis 1 9 ist, auf/in dem dem Selektionsgen entsprechenden Selektionsmedium kultiviert, daB man die gewachsenen Zell- 
klone erntet, und daB man aus diesen ZellWonen die HCV-RNA-Konstrukte isoliert. 
15 [0036] Bei einer vorteilhaften Weiterbildung dieses Herstellungsverfahrens werden die isolierten HCV-RNA-Kon- 
strukte wenigstens einmal erneut passagiert, namlich in Zellen eines Zellkultursystems nach Anspruch 1 einge- 
schleust, das dabei erhaltene Zellkultursystem gemaB Anspruch 1 , bei dem das eingeschleuste HCV-spezifische 
Genmaterial das isolierte HCV-RNA-Konstrukt mit Selektionsgen ist, auf/in dem dem Selektionsgen entsprechenden 
Selektionsmedium kultiviert, die gewachsenen Zellklone geerntet und daraus die HCV-RNA-Konstrukte isoliert. 
20 Mit dieser Verfahrensvariante kann der Grad der adaptiven Mutationen und damit der Grad der Replikationseffizienz in 
den betreffenden HCV-RNA-Konstrukten noch gesteigert werden. 

[0037] Das erfindungsgemaBe Verfahren zur Herstellung von Mutanten eines HCV - Vollangengenoms Oder eines 
HCV- Teilgenoms Oder eines beliebigen HCV-RNA-Konstrukts mit im Vergleich zu dem ursprunglichen HCV- Vollangen- 
genom Oder - Teilgenom Oder HCV-RNA-Konstrukt erhohter Replikationseffizienz zeichnet sich dadurch aus, daB man 

25 mit Hilfe eines der beiden vorstehend genannten Herstellungsverfahren eine zellkultur-adaptierte Mutante eines HCV- 
RNA-Konstrukts herstellt, diese aus den Zellen isoliert, mit im Stand der Technik bekannten Methoden kloniert und 
sequenziert und durch Vergleich mit der Nukleotid- und Aminosauresequenz des ursprunglichen HCV-RNA-Konstrukts 
die Art, Anzahl und Positionen der Mutationen bestimmt, und diese Mutationen dann entweder durch gezielte Mutage- 
nese Oder durch Austausch von Sequenzabschnitten, welche die betreffenden Mutationen enthalten, in ein (isoliertes) 

30 HCV-Vollangen- oder -teilgenom oder ein beliebiges HCV-RNA-Konstrukt einfuhrt. 

Zum Nachweis bzw. zur Verifizierung derjenigen Mutationen, die tatsachlich eine Veranderung der Replikation und ins- 
besondere eine Replikationssteigerung bewirken, kann ein Testdurchgefiihrt werden, bei dem die bestimmten Nukleo- 
tid- und/oder Aminosaureaustausche in das ursprungliche HCV-RNA-Konstrukt eingefuhrt und dieses wiederum in 
Zellkultur eingeschleust wird. Wenn die eingefuhrte Mutation tatsachlich zu einer Steigerung der Replikation fuhrt, 

35 sollte im Fall eines HCV-RNA-Konstrukts mit selektierbarem Markergen die Zahl der resistenten Zellklone bei dem 
kunstlich mutierten Konstrukt deutlich hoher sein als bei dem unbehandelten Konstrukt. Im Fall eines Konstrukts mit 
einem Reportergen sollte die Aktivitat bzw. Menge des Reporters bei dem kunstlich mutierten Konstrukt deutlich hoher 
sein als bei dem unbehandelten. 

[0038] Die erfindungsgemaBen zellkultur-adaptierten HCV-RNA-Konstrukte mit hoher Replikationseffizienz sind 
40 dadurch gekennzeichnet, daB sie durch Nukleotid- und/oder Aminosaureaustausche von einem HCV-RNA-Konstrukt 
nach einem der AnsprCiche 4 bis 19 ableitbar sind und daB sie mit einem der beiden vorstehend genannten Herstel- 
lungsverfahren erhaltlich sind. 

[0039] Diese zellkultur-adaptierten HCV-RNA-Konstrukte konnen dazu verwendet werden, beliebige HCV-RNA- 
Konstrukte oder HCV-Vollangen- oder Teilgenome mit erhohter Replikationseffizienz herzustellen. Dabei konnen 
45 sowohl Konstrukte mit einem selektierbaren Resistenzgen als auch Konstrukte ohne ein solches bzw. mit einem nicht- 
selektierbaren Reportergen (z.B. Luziferase) hergestellt werden, denn aufgrund der sehr hohen Replikationseffizienz 
des zellkultur-adaptierten HCV-RNA-Konstrukts kann dessen Replikation auch in nicht-selektionierten Zellen nachge- 
wiesen werden. 

Die erfindungsgemaBen zellkultur-adaptierten Mutanten eines HCV-RNA-Konstrukts oder eines HCV-Vollangenge- 
50 noms oder eines HCV-Teilgenoms mit im Vergleich zu dem ursprunglichen HCV-RNA-Konstrukt oder dem ursprungli- 
chen HCV-Vollangengenom erhohter Replikationseffizienz , sind dadurch charakterisiert, daB sie mit einem Verfahren 
erhaltlich sind, bei dem man in einem zellkultur-adaptierten HCV-RNA-Konstrukt durch Sequenzanalyse und Sequenz- 
vergleich die Art und Anzahl der Mutationen bestimmt und diese Mutationen in ein HCV-RNA-Konstrukt, insbesondere 
in ein HCV-RNA-Konstrukt gemaB einem der Anspruche 4 bis 19, oder in ein (isoliertes) HCV-RNA-Vollangengenom 
55 einfuhrt, entweder durch gezielte Mutagenese oder durch Austausch von Sequenzabschnitten, die die betreffenden 
Mutationen enthalten. 

[0040] Eine Gruppe ganz bevorzugter HCV-RNA-Konstrukte, HCV-Vollangengenome und HCV-Teilgenomen mit 
hoher und sehr hoher Replikationseffizienz und infolgedessen sehr guter Eignung fur die praktische Anwendung ist 
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dadurch gekennzeichnet, daR sie einen oder mehrere oder alle der in Tabelle 3 aufgelisteten Aminosaure- bzw. Nukleo- 
tidaustausche und/oder einen oder mehrere der folgenden Aminosaureaustausche aufweist: 1283 arg -> gly , 1383 glu 
-> ala , 1577 lys -> arg , 1609 lys -> glu , 1936 pro -> ser , 2163 glu -> gly , 2330 lys -> glu , 2442 ile -> val. (Die Zahlen 
beziehen sich auf die Aminosaurepositionen des Polyproteins des HCV-lsolats con1 , siehe Tabelle 1). 

Besondere Eigenschaften der in den Sequenzprotokollen angegebenen Sequenzen: 

SEQ ID-NO: 1 

[0041] 

Name: l389/Core-37wt 
Aufbau (NuWeotidpositionen): 

1. 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B 

5. 1813-2385: HCV Core Protein; Strukturprotein 

6. 2386-2961: Hullprotein 1 (envelope protein 1); Strukturprotein 

7. 2962-4050: Hullprotein 2 (envelope protein 2); Strukturprotein 

8. 4051 -4239: Protein p7 

9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

11. 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A(NS5A) 

14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 
15. 10846-11076: HCV 3' nicht-translatierte Region 

SEQ ID-NO: 2 

[0042] 

Name: l337/NS2-37wt 
Aufbau (NuWeotidpositionen): 

1. 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 181 : HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1 190-1800: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 



4. 1801-8403: HCV Polyprotein von Nichtstrukturprotein 2 bis Nichtstrukturprotein 5B 
5. 1801-2451 : Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

6. 2452-4344: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

7. 4345-4506: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

8. 4507-5289: Nichtstrukturprotein 4B (NS4B) 

9. 5290-6630: Nichtstrukturprotein 5A(NS5A) 

10. 6631-8403: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 

1 1 . 8407-8637: HCV 3' nicht-translatierte Region 
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SEQ ID-NO: 3 

[0043] 

Name: l389/NS3-3'/wt 
Aufbau (NuWeotidpositionen): 

1 . 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5A (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 

10. 7771-8001 : HCV 3' nicht-translatierte Region 

SEQ ID-NO: 4 



Name: l337/NS3-3'/wt 
Aufbau (NuWeotidpositionen): 

1 . 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 181 : HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1190-1800: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1801-7758: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B 

5. 1801-3696: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3697-3858: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3859-4641 : Nichtstrukturprotein 4B (NS4B) 

8. 4642-5982: Nichtstrukturprotein 5A (NS5A) 

9. 5983-7755: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 

10. 7759-7989: HCV 3' nicht-translatierte Region 

SEQ ID-NO: 5 

[0045] 

Name: l389/NS2-3'/wt 
Aufbau (NuWeotidpositionen): 

1 . 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-8418: HCV Polyprotein von Nichtstrukturprotein 2 bis Nichtstrukturprotein 5B 

5. 1813-2463: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

6. 2464-4356: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

7. 4357-4518: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

8. 4519-5301 : Nichtstrukturprotein 4B (NS4B) 

9. 5302-6642: Nichtstrukturprotein 5A (NS5A) 



10 



EP 1 043 399 A2 



10. 6643-8415: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 

1 1 . 8419-8649: HCV 3' nicht-translatierte Region 

SEQ ID-NO: 6 
[0046] 

Name: I389/NS3-379-13F 
Aufbau (NuWeotidpositionen): 

1. 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B der zellkultur-adaptier- 
ten Mutante 9-1 3F 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5A (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 7771-8001: HCV 3' 
nicht-translatierte Region 

SEQ ID-NO: 7 

[0047] 

Name: l389/Core-379-13F 
Aufbau (NuWeotidpositionen): 

1. 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-1 0842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B der zellkultur-adaptierten Mutante 9-13F 

5. 1813-2385: HCV Core Protein; Strukturprotein 

6. 2386-2961 : Hullprotein 1 (envelope protein 1); Strukturprotein 

7. 2962-4050: Hullprotein 2 (envelope protein 2); Strukturprotein 

8. 4051-4239: Protein p7 

9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

11. 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 
15. 10846-11076: HCV 3' nicht-translatierte Region 

SEQ ID-NO: 8 

[0048] 

Name: I389/NS3-3V5.1 
Aufbau (NuWeotidpositionen): 

1. 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 
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3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B der zellkultur-adaptier- 
ten Mutante 5.1 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5B (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 7771-8001: HCV 3' 
nicht-translatierte Region 

SEQ ID-NO: 9 



Name: l389/Core-375.1 
Aufbau (NuWeotidpositionen): 

1 . 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B der zellkultur-adaptierten Mutante 5.1 

5. 1813-2385: HCV Core Protein; Strukturprotein 

6. 2386-2961 : HLillprotein 1 (envelope protein 1); Strukturprotein 

7. 2962-4050: Hiillprotein 2 (envelope protein 2); Strukturprotein 
8.4051-4239: Protein p7 

9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

1 1 . 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 
15. 10846-11076: HCV 3' nicht-translatierte Region 

SEQ ID-NO: 10 

[0050] 

Name: I389/NS3-3Y19 
Aufbau (NuWeotidpositionen): 

1 . 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-7767: HCV Polyprotein von Nichtstrukturprotein 3 bis Nichtstrukturprotein 5B der zellkultur-adaptier- 
ten Mutante 19 

5. 1813-3708: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

6. 3709-3870: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

7. 3871-4653: Nichtstrukturprotein 4B (NS4B) 

8. 4654-5994: Nichtstrukturprotein 5A (NS5A) 

9. 5995-7767: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RNA-Polymerase 7771-8001: HCV 3' 
nicht-translatierte Region 
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SEQ ID-NO: 11 

[0051] 

Name: l389/Core-3'/19 
Aufbau (NuWeotidpositionen): 

1. 1-341 : HCV 5' nicht-translatierte Region 

2. 342-1 193: HCV Core Protein-Neomycin Phosphotransferase Fusionsprotein; selektionierbarer Marker 

3. 1202-1812: Interne Ribosomenbindungsstelle des Encephalomyokarditis Virus; erlaubt die Translation des 
dahinterliegenden HCV offenen Leserasters 

4. 1813-10842: HCV Polyprotein von Core bis Nichtstrukturprotein 5B der zellkultur-adaptierten Mutante 19 

5. 1813-2385: HCV Core Protein; Strukturprotein 

6. 2386-2961 : Hullprotein 1 (envelope protein 1); Strukturprotein 

7. 2962-4050: Hullprotein 2 (envelope protein 2); Strukturprotein 

8. 4051-4239: Protein p7 

9. 4240-4890: Nichtstrukturprotein 2 (NS2); HCV NS2-3 Protease 

10. 4891-6783: Nichtstrukturprotein 3 (NS3); HCV NS3 Protease/Helikase 

11. 6784-6945: Nichtstrukturprotein 4A (NS4A); NS3 Protease Kofaktor 

12. 6946-7728: Nichtstrukturprotein 4B (NS4B) 

13. 7729-9069: Nichtstrukturprotein 5A (NS5A) 

14. 9070-10842: Nichtstrukturprotein 5B (NS5B); RNA-abhangige RN A- Polymerase 
15. 10846-11076: HCV 3' nicht-translatierte Region 

[0052] Die Erfindung wird im folgenden anhand von Ausfuhrungsbeispielen und dazugehorigen Tabellen und Figu- 
ren naher erlautert. Die erwahnten Figuren zeigen 

Fig. 1 A: Die Struktur eines erfindungsgemaBen HCV-RNA-Konstrukts Ganz oben ist eine schematische Darstel- 
lung der Struktur des kompletten pai entalen HCV-Genoms gegeben mit den Positionen der Gene fur die 
Spaltungsprodukte core, E1, E2, p7, NS2, NS3, NS4A, NS4B, NS5A und NS5B innerhalb des Polypro- 
teins, und den 5' und 3' nichttranslatierten Regionen (5' NTR und 3' NTR) als Horizontalbalken darge- 
stellt — , und mit den beiden fur die Erzeugung der Subgenom-Konstrukte ausgewahlten Positionen, 
namlich der Position der 'GDD-katalyiischen Domane' der NS5B RNA Polymerase (GDD) und der Posi- 
tion der 3' GrenzederHCV-IRES (NuWeotidpositionen 1 bis377bzw. 1 bis 389)— oberhalb des Genom- 
schemas eingezeichnet — . Die Zahlen unterhalb des Genomschemas bezeichnen die entsprechenden 
NuWeotidpositionen. 

Darunter sind schematische Darstellungen der Strukturen zweier erfindungsgemaBer, modifizierter 
HCV-RNA-Konstrukte (Subgenom) gezeigt, bestehend aus der 5' HCV-IRES, dem Neomycinphospho- 
transferasegen (Neo R ), der EMCV-IRES (E-i) und den HCV Sequenzen von NS2 bzw. NS3 bis zum 
authentischen 3' Ende. Die Position der das NS5B Polymerase GDD-Motiv umfassenden 10 Aminosau- 
ren-Deletion ist jeweils mit einem Dreieck (A) marWert. 

Fig. 1 B: Das Ergebnis einer denaturierenden Formaldehyd-Agarose-Gelelektrophorese zum Nachweis von repli- 
zierter Plusstrang-RNA in transfizierten subpassagierten Huh-7 Zellklonen. 

Die Positionen der HCV-spezifischen RNAs (Pfeile) und der 28S rRNA sind rechts von Spur 1 2 angege- 
ben, die GroBen (Anzahlen der Nukleotide) der RNA-Marker (M) sind links von Spur 1 angegeben. 

Fig. 1 C : Das Ergebnis eines PCR-Tests mit nachfolgendem Southern-Blot zum Nachweis der Abwesenheit von 
integrierter Replikon-DNA in den meisten der selektierten ZellWone. 

Spuren 1 und 2 zeigen die Positivkontrollen, Spur 13 die Negativ-Kontrolle. Die Zahlenangaben links der 
Spur 1 bezeichnen die GroBe der Nukleotid-Marker-Molekule. 

Fig. 2 A: Das Ergebnis eines PCR-Tests mit nachfolgendem Southern-Blot zum sensitiven AusschluB integrierter 
Replikon-DNA (Plasmid Molekule l 377 /NS3-3'Awt) in einem HCV-RNA-Konstrukt-haltigen Zellklon (9-13). 
Die Spuren 7 bis 1 1 reprasentieren das Ergebnis einer Titration von DNA-Molekulen des Konstrukts 
l 377 /NS3-3'/wt ohne Zugabe von Gesamt-DNA des Zellklons 9-13 und die Spuren 2 - 6 reprasentieren 
die gleichen Plasmidmolekule mit Zugabe von jeweils 1 9-13 DNA vor der PCR (zwecks AusschluB 
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eines Inhibitors der PCR in der DNA-Praparation). Spur 13 reprasentiert die Negativ-Kontrolle (PCR 
ohne DNA-Sonde). Spur 1 zeigtdas Ergebnis, das mit einem ug Gesamt-DNA des Zellkons 9-13 erhal- 
ten wurde. 

Fig. 2 B: Das Ergebnis eines Northern-Blot-Tests zur Quantifizierung von HCV Plus- und Minusstrang RNA. 

Die Pfeile markieren die Positionen von Replikon-RNA. Die "plus" und "minus" -Abgaben bezeichnen die 
positive (plus) bzw. negative (minus) Polaritat der RNA-Kontrollen, die auf das Gel aufgetragen wurden. 
"Minusstrand" und "Plusstrand" bezeichnen die Spezifitat der radioaktiven RNA-Sonden. 

Fig. 2 C: Ergebnis einer Formaldehyd-Agarose-Gelelektrophorese nach radioaktiver Markierung der intrazellular 
replizierten HCV-RNA zum Nachweis der Resistenz der HCV-RNA-Replikation gegen Dactinomycin. 

Fig. 3 A: Nachweis von HCV-spezifischen Antigenen in den selektierten Zellklonen mittels Immunoprazipitation 
nach metabolischer Radioaktivmarkierung. Die Spuren 7 - 9 reprasentieren authentische GroBenmarker 
(die nach transienter Expression eines HCV-RNA-Konstrukts in Huh-7-Zellen erhalten wurden); identifi- 
zierte HCV-Proteine sind am linken Rand von Spur 1 markiert, die Molekulargewichte (in Kilodalton) sind 
am rechten Rand von Spur 9 angegeben. 

Fig. 3 B: Ergebnisse eines Immunf luoreszenztests zum Nachweis der subzellularen Lokalisation von HCV Antige- 
nen. 

Fig. 4: Schematische Darstellung der Struktur eines erfindungsgemafien selektierbaren HCV-RNA-Konstrukts 
(komplettes Genom) bestehend aus der 5' HCV-IRES, dem Neomycinphosphotransferasegen (NeoR), 
einem heterologen IRES-Element, z.B. des Encephalomyocarditisvirus (E-l), dem vollstandigen HCV- 
Leseraster und der authentischen 3' NTR. 

Fig. 5: Schematische Darstellung der Struktur von HCV-RNA-Konstrukten mit insertiertem Antibiotikumresi- 
stenzgen (A) innerhalbder fur das Polyprotein kodierenden Nukleotidsequenz (monocistronische RNA), 
und (B) innerhalb der 3' NTR (bicistronische RNA). 

Fig. 6: Schematische Darstellung der Struktur von HCV-RNA-Konstrukten mit insertiertem Reportergen (A) als 
Teil eines HCV-Replikons von NS3 bis NS5B; das Reporterprotein wird letztendlich durch virale Oder 
durch zellulare Proteasen aus dem Polyprotein gespalten und das selektierbare Markergen (Selektions- 
gen) bzw. das Resistenzgen durch Kontransfektion in die Zellen einschleust , (B) als Teil eines Fusions- 
gens aus Resistenz- und Reportergen (z.B. fur die Neomycinphosphotransferase und green fluorescent 
Protein) (C) als Teil eines Replikons aus Resistenz- und Reportergen (z.B. fur die Neomycinphospho- 
transferase und das green fluorescent Protein), die uber eine Nukleotidsequenz verbunden sind, welche 
fur eine Aminosauresequenz kodiert (schraffierter Bereich), die von einer Protease gespalten werden 
kann oder die uber eine selbstspaltende (autokatalytische) Aktivitat verfugt, (D) als unabhangiges Gen 
(hier green fluorescent protein), das von einer eigenen internen Ribosomenbindungsstelle (IRES) aus 
exprimiert wird; —das Resistenzgen (hier: Neomycinphosphotransferase-Gen) wird davon unabhangig 
ebenfalls von einer eigenen internen Ribosomenbindungsstelle (IRES) aus exprimiert (polycistronisches 
Konstrukt). 

Fig. 7: Schematische Darstellung der Struktur eines HCV-RNA-Konstrukts bei dem das Resistenzgen uber ein 
Ribozym bzw. eine Erkennungsstelle fur ein Ribozym mit der HCV-RNA-Sequenz verbunden ist. Die dik- 
ken Linien stellen die HCV 5' und 3' NTRs dar, E-l ist eine heterologe interne Ribosomenbindungsstelle, 
die fur die Expression des Resistenzgens notwendig ist, und das graue Quadrat stellt das Ribozym bzw. 
eine Erkennungsstelle fur ein Ribozym dar. 

Fig. 8: Schematische Darstellung der Struktur eines HCV-RNA-Konstrukts mit Resistenzgen und integriertem 
Fremdgen. 

Fig. 9: Methodisches Vorgehen zum Vergleich der spezifischen Infektiositat (ausgedruckt als Anzahl gebildeter 
Zellkolonien) von Gesamt-RNA versus in vitro Transkripte. HCV-RNA wird mittels in vitro Transkription 
eines entsprechenden RNA-Konstrukts hergestellt und durch Messung der optischen Dichte bei 260 nm 
(OD 260 nm) quantifiziert. Eine definierte Anzahl dieser Molekule wird mit einer bestimmten Menge 
Gesamt-RNA von nai'ven Huh-7 Zellen gemischt und diese Mischung mit Hilfe der Elektroporation in 
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naive Huh-7 Zellen eingeschleust. Parallel dazu wird die Gesamt-RNA eines Zellklons, der mit der in 
Figur 1 beschriebenen Methode hergestellt wurde, mit einem im Stand der Technik bekannten Verfahren 
isoliert und die Menge der darin enthaltenen HCV-RNA mittels Northern-blot unter Verwendung einer 
HCV-spezifischen RNA-Sonde und anschlieRender Quantifizierung mittels Phosphoimager bestimmt. 

5 Eine definierte Menge dieser Gesamt-RNA wird analog den in vitro Transkripten in naive Huh-7 Zellen 

transfiziert. Diese Zellen in beiden Ansatzen werden danach einer G418-Selektion unterzogen und die 
Anzahl der gebildeten Kolonien durch Auszahlen nach fixieren und anfarben mit Coomassie-Brilliant- 
Blau bestimmt. Zur Bestimmung der Transfektionseff izienz wird jedem Transfektionsansatz 1 ng eines 
Plasmids zugesetzt, das die Expression der Luziferase erlaubt. Ein Aliquot der transfizierten Zellen wird 

w nach 24 Stunden geerntet und die Luziferaseaktivitat im jeweiligen Zellysat bestimmt. Die Anzahl der 

Kolonien wird jeweils auf die Luziferaseexpression normiert. 

Fig. 10: Sequenzanalyse der 9-13 Klone. Gesamt-RNA des Zellklons 9-13, der durch Transfektion des HCV- 
RNA-Konstrukts I377/NS3-3' entstand, wurde mit einem im Stand der Technik bekannten Verfahren iso- 
15 liert und das HCV-RNA-Konstrukt von Nukleotidposition 59 bis 9386 mit Hilfe der long-distance RT-PCR' 

unter Verwendung der primer S59 und A9413 amplizifiert. Die PCR-Fragmente wurden kloniert und 1 1 
Klone (genannt 9-13 A - K) vollstandig sequenziert, wobei sich die Klone D und I, E und G sowie H und 
J als identisch erwiesen. Die Positionen der Aminosaureunterschiede in der NS3-5B Region zwischen 
den reklonierten HCV-RNAs und dem parentalen Konstrukt sind mit einem dicken vertikalen Strich beim 
20 jeweiligen Klon markiert. Jeder Klon wurde mit dem Restriktionsenzym Sfi 1 verdaut und das jeweilige 

Fragment in das parentale Konstrukt inseriert. Diese Klone wurden jeweils in Huh-7 Zellen transfiziert 
und die Zellen wie in Figur 1 beschrieben einer Selektion unterzogen. Die Anzahl der mit jedem Kon- 
strukt erhaltenen Zellklone ist rechts neben dem jeweiligen Konstrukt vermerkt. 

Prinzip der Replikationsbestimmung mit Hilfe eines Reportergens. Im oberen Teil der Figur ist das HCV- 
DNA-Konstrukt l 389 /Luc/NS3-3' dargestellt, bestehend aus der HCV 5' NTR (Nukleotidposition 1-389), 
dem Luziferasegen (/uc), der IRES des Encephalomyocarditis Virus, dem HCV NS3-5B und der 3' NTR. 
Die Position des aktiven Zentrums der NS5B RNA-Polymerase, in das ein inaktivierender Aminosaure- 
austausch eingefilhrt wurde, ist mit GND' angedeutet. Die Plasmide, die fur das replikationskompetente 
bzw. das defekte HCV-RNA-Konstrukt kodieren, werden mit dem Restriktionsenzym Sea I verdaut und 
in eine in vitro Transkription mit der T7 RNA-Polymerase eingesetzt. Nach Entfernung der Matrizen-DNA 
werden die jeweiligen HCV-RNA-Konstrukte mittels Elektroporation in naive Huh-7 Zellen eingeschleust 
und diese in regelmaGigen Abstanden geerntet. 

35 Fig. 11 B: Vergleich der Luziferaseaktivitaten in Zellen transfiziert mit dem parentalen HCV-RNA-Konstrukt 
l 389 /Luc/NS3-3'/wt (wt) Oder den folgenden Varianten: Der inaktiven RNA (318 DN), der Variante 9-1 3F 
Oder der Variante 5.1. Die Zellen wurden 6 (nicht gezeigt), 24, 48, 72, 96, 120, 144 und 168 Stunden 
nach der Transfektion geerntet und die Luziferaseaktivitaten luminometrisch bestimmt. 

40 Fig. 12: Selektionierbare HCV-Vollangengenome (Konstrukte l 389 /core-375.1 und l 389 /core-379-13F). 

(A) Schematische Darstellung des Vollangenkonstrukts. Der Bereich zwischen den beiden ange- 
deuteten Erkennungsstellen fur das Restriktionsenzym Sfi I entspricht den Sequenzen der hoch- 
adaptierten RNA-Varianten 5.1. oder9-13F. 
45 (B) Anzahl der Kolonien die nach Transfektion von jeweils 0,1 \ig in vitro transkribierter RNA der 

unter A dargestellten Konstrukte l 38g /core-375.1 in HUH7-Zellen erhalten wurden. Angegeben ist 
das Ergebnis eines reprasentativen Experimentes. 

(C) Nachweis autonom replizierender HCV-Vollangen-RNAs in G418-resistenten ZellWonen, die 
nach Transfektion des entsprechenden in vitro Transkripts erhalten wurden. Die Abbildung zeigtdas 

so Autoradiogramm eines Northern Blots, der mit einer Sonde gegen das neo-Resistenzgen und der 

HCV 5' NTR hybridisiert wurde. Die in Spur 1 und 2 dargestellten Kontrollen entsprechen jeweils 1 0 8 
Molekulen der angegebenen in vitro Transkripte, gemischt mit Gesamt-RNA aus naiven Huh-7 Zel- 
len. Die Negativkontrolle enthalt ausschlieRlich Gesamt RNA aus naiven Huh-7 Zellen (Spur 3). Die 
Spuren 4-9 enthalten 3-10 ng Gesamt-RNA aus G418-resistenten Zellklonen, die nach Transfektion 

55 von in vitro transkribierter l 389 /core-3'/5.1-RNA bzw. l 389 /core-3'/9-13F-RNA erhalten wurden. Die 

fur die Selektion verwendete G418-Konzentration ist jeweils angegeben. Funf der dargestellten Zell- 
klone enthalten die hoch adaptierte RNA-Variante 5. 1 (Spur 4-8), einer die adaptierte RNA- Variante 
9-13F(Spur9). 



25 Fig. 11 A: 
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Fig. 13: HCV-RNA-Konstrukte mit einem Reportergen. (A) Bicistronische HCV-RNA-Konstrukte. Das Reporter- 
gen wird mit Hilfe einer separaten IRES translatiert. (B) Monocistronische HCV-RNA-Konstrukte. Das 
Reportergenprodukt wird als Fusionsprotein mit einem HCV-Protein exprimiert. Die beiden Anteile sind 
uber eine Erkennungssequenz fur eine virale oder zellulare Protease verbunden, die eine proteolytische 
Trennung der beiden fusionierten Proteinanteile erlaubt. Im gezeigten Beispiel wurden das Reportergen- 
produkt und das jeweilige HCV-Protein uber eine Erkennungssequenz fur Ubiquitin (Ub) fusioniert. 

Fig. 14: Tricistronisches Vollangen HCV-RNA-Konstruki, das zusatzlich zum Resistenzgen ein Fremdgen inse- 
riert besitzt. 

Fig. 15: Monocistronische HCV-RNA-Konstrukte, bei denen das Resistenzgenprodukt als Fusionsprotein mit 
dem HCV-Anteil exprimiert wird. Das Resistenzgen (RG) ist entweder als Fusionsprotein aktiv oder es 
wird so mit einer proteolytisch spaltbaren Sequenz mit dem HCV-Anteil fusioniert, dal3 das Resistenz- 
genprodukt durch eine zellulare oder virale Protease vom HCV-Anteil abgespalten wird. Im gezeigten 
Beispiel wurde das Resistenzgen uber die fur Ubiquitin (Ub) kodierende Sequenz mit dem jeweiligen 
HCV-Anteil fusioniert. 

Beispiel 1 : Herstellung von HCV-RNA-Konstrukten 

( A) Synthese und Klonierung eines vollstandigen HCV-Konsensusgenoms mittels RT- PCR 

[0053] Aus der Leber eines chronisch infizierten Patienten wurde das HCV-Genom, d.h. die HCV-RNA wie nachfol- 
gend beschrieben isoliert: 

[0054] Aus ca. 100 mg Leber wurde die komplette RNA gemafi dem Verfahren von Chomczynski und Sacci (1987, 
Anal. Biochem. 162, 156) isoliert. Mit 1 ug dieser isolierten RNA wurde eine reverse Transkription mit den Primern 
A6103 (GCTATCAGCCGGTTCATCCACTGC) oder A9413 (CAGGATGGCCTATTGG CCTGGAG) und dem 'expand 
reverse transcriptase'- System (Boehringer Mannheim, Deutschland) nach den Vorschriften des Herstellers durchge- 
ftihrt. Mit den Produkten dieser reversen Transkription (RT) wurde eine Polymerase-Kettenreaktion (PCR=polymerase 
chain reaction) durchgefuhrt, und zwar unter Verwendung des expand long template'-Systems (Boehringer Mannheim, 
Deutschland), wobei der Puffer mit 2% Dimethylsulfoxid-Gehalt eingesetzt wurde. Nach einer Stunde bei 42°C wurde 
1/8 dieses Reaktionsansatzes in einem ersten PCR-Durchgang mit den Primern A6103 und S59 (TGTCTTCACGCA- 
GAAAGCGTCTAG) Oder A9413 und S4542 (GATGAGCT CGCCGCGAAGCTGTCC) eingesetzt. Nach 40 Zyklen 
wurde 1/10 dieses Reaktionsansatzes in einem zweiten PCR-Durchgang mit den Primern S59 und A4919 (AGCACA- 
GCCCGCGTCATAGCACTCG) Oder S4542 und A9386 (TTAGCTCCCCG TTCATCGGTTGG) eingesetzt. Nach 30 
Zyklen wurden die PCR-Produkte mittels praparativer Agarose-Gel-Elektrophorese gereinigt und die dabei eluierten 
Fragmente wurden in den Vektor pCR2.1 (Invitrogen) oder pBSK II (Stratagene) ligiert. Vier Klone von jedem Fragment 
wurden analysiert und sequenziert, und es wurde eine Konsensus-Sequenz ermittelt. Zu diesem Zweck wurden die 
DNA-Sequenzen miteinander verglichen. Die Positionen, an denen sich die Sequenz eines der Fragmente von den 
ubrigen unterschied, wurde als unerwunschte Mutation betrachtet. Im Fall von Mehrdeutigkeiten der Sequenz wurden 
kurzere sich uberlappende PCR-Fragmente der betreffenden Region amplifiziert und mehrere Klone sequenziert. Auf 
diese Weise konnten zahlreiche potentielle Mutationen in jedem Fragment identif iziert und somit eine isolat-spezif ische 
Konsensussequenz etabliert werden. Diese etablierte Konsensussequenz bzw. dieses Genom gehort zum weltweit 
verbreiteten Genotyp 1b. Die nicht translatierte Region am 3'-Ende (=3' NTR) wurde mittels konventioneller PCR erhal- 
ten, wobei ein Antisense-Primer eingesetzt wurde, der die letzten 24 Nukleotide des im Stand der Technik bekannten 
'X-tails' (Tanaka et al., 1995, Biochem. Biophys. Res. Commun. 215, 744; und Rice, PCT/US 96/14033) abdeckt. Die 
authentische nicht translatierte Region am 5'-Ende (=5' NTR) strangabwarts vom T7 Promoter wurde mittels PCR 
erzeugt, wobei zum einen ein OligonukJeotid verwendet wurde, das einem verkurzten T7 Promotor (TAA TAC GAC TCA 
CTA TAG) und den ersten 88 NuWeotiden von HCV entspricht, und zum anderen eines der vorgenannten Plasmide ein- 
gesetzt wurde, das eines der 5' Fragmente des Genoms tragi Aus den subgenomischen Fragmenten mit der gering- 
sten Anzahl an Nicht-Konsensus-Austauschen wurde ein komplettes HCV-Konsensusgenom zusammengesetzt und in 
einen modifizierten pBR322-Vektor insertiert. Abweichungen von der Konsensussequenz wurden mittels ortsgerichte- 
ter Mutagenese ("site-directed mutagenesis) beseitigt. Urn "run-off'-Transkripte mit einem authentischen 3' Ende her- 
zustellen, wurde die 3'-NTR der Isolate (mit dem Ende TGT) zu AGT modifiziert (gemaB der Sequenz vom Genotyp 3 
= Klon 'WS' nach Kolykhalov et al., 1996, J. Virol. 70, 3363) und auBerdem wurde ein zusatzlicher Nukleotidaustausch 
an Position 9562 vorgenommen, urn die A:T Basenpaarung in der Haarnadelstruktur am 3' Ende der 3' NTR (Kolyhalov 
et al. ibid.) beizubehalten. Urn eine interne Restriktionsstelle fur das Enzym Seal zu beseitigen, wurde ferner ein sog. 
stiller ("silent") Nukleotidaustausch vorgenommen. Nach dem Zusammenfugen des Vollangen-Genoms mit passenden 
5'- und 3' NTRen wurde die komplette HCV-Sequenz iiberpruft. Dabei wurde kein ungewiinschter Nukleotidaustausch 
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gefunden. 

[0055] Das auf diese Weise hergestellte HCV-Genom sollte per Definition hepatotrop sein. 

(B) Synthese selektierbarer HCV-Subgenom-Konstrukte 

[0056] Unter Verwendung des unter (A) beschriebenen Konsensusgenoms wurden HCV-Subgenom-Konstrukte 
hergestellt, die das Antibiotikumresistenzgen Neomycin-Phosphotransferase (NPT) und zwei Sequenzen von internen 
Ribosomenbindungsstellen (IRES) enthalten. Die hierfiirangewendeten biochemischen Verfahrenstechniken sind dem 
Fachmann bekannt und gelaufig (siehe: Sambrook, J., E.F. Fritsch, T. Maniatis, 1989, Molecularcloning: a laboratory 
manual, 2nd ed., Cold Spring Harbour Laboratory, Cold Spring Harbor, N.Y.; Ausubel et al. (eds.), 1994, Current Proto- 
cols in Molecular Biology, Vol. 1 -3, John Wiley & Sons Inc., New York). Das Antibiotikumresistenzgen wurde unmittelbar 
hinter der 5' NTR insertiert, wodurch eine bicistronische RNA erhalten wurde (siehe Fig. 1 A). Ebensogut kann das Anti- 
biotikumresistenzgen aber auch an anderer Stelle des HCV-Subgenom-Konstrukts insertiert werden, beispielsweise 
innerhalb der fur das Polyprotein kodierenden NuWeotidsequenz, wodurch eine monocistronische RNA erhalten wird 
(siehe Fig. 5 A) oder in die 3' NTR (siehe Fig. 5 B). Bei den IRES-Elementen handelt es sich zum einen urn eine der 
beiden HCV-IRES-Varianten Nukleotide 1-377 oder NuWeotide 1-389, und zum anderen urn die IRES des Enzephalo- 
myocarditis Virus, die die Translation der HCV Sequenz strangabwarts von den Genen fur NS2 oder NS3 bis zu dem 
authentischen 3' Ende des Genoms steuert. 

[0057] Die beiden genannten HCV-IRES-Varianten wurden wie folgt ermittelt: Auf der Basis von Deletionsanalysen 
der 3' Grenze der HCV-IRES (Reynolds et al. 1995, EMBO J. 14, 6010) wurden verschiedene Abschnitte der 5' NTR 
mit dem NPT Gen fusioniert und anhand von Kotransfektionen mit einem das T7 RNA Polymerase Gen enthaltenden 
Plasmid hinsichtlich der maximalen Anzahl gebildeter Kolonien analysiert. Die besten Ergebnisse wurden mit den HCV 
Sequenzen von 1 -377 und 1 -389 erhalten. Da sich das AUG-Startkodon des HCV Polyproteins an Position 342 bef indet 
und somit in der IRES-Sequenz enthalten ist, kommt es zu einer Fusion von 12 bzw. 16 Aminosauren des HCV-Kap- 
sidproteins ("Core-Proteins") mit der Neomycin Phosphotransferase (siehe Fig. 1 A). 

[0058] Diese modifizierten HCV-Subgenom-Konstrukte erhielten dementsprechend die Bezeichnungen l 377 /NS2- 
3' (oder l 377 /NS3-3') und l 389 /NS2-3' (oder l 389 /NS3-3'). Sie sind in Fig. 1A schematisch dargestellt. 
[0059] Mit in-vitro-Transkripten dieser modifizierten parentalen HCV-Subgenom-Konstrukte l 377 /NS2-3' (oder 
l 377 /NS3-3') und l 389 /NS2-3' (oder l 389 /NS3-3') wurden verschiedene Zellinien und Primarzellkulturen von menschli- 
chen Hepatocyten transfiziert. 

[0060] Als parallele Negativ-Kontrolle zu alien Transfektionsexperimenten wurde zu jedem modifizierten parentalen 
HCV-Subgenom-Konstrukt ein entsprechend modifiziertes aber defektes Subgenom konstruiert, das sich von dem par- 
entalen dadurch unterscheidet, da(3 es innerhalb des Leserasters eine Deletion von 10 Aminosauren aufweist, die das 
aktive Zentrum der NS5B RNA Polymerase umfaBt (Behrens et al., 1996, EMBO J. 15, 12; und Lohmann et al., 1997, 
J. Virol. 71,8416). 

(C) Synthese selektierbarer HCV-Genom-Konstrukte 

[0061 ] Ein NS2-3' Subgenomkonstrukt, das am 5' Ende mit einem Fragment des Luziferasegens und der vollstan- 
digen EMCV-IRES verbunden ist, wurde mitNcol und Spel restringiert und mittels praparativer Agarosegelelektropho- 
rese gereinigt. Der so erhaltene Vektor wurde in einer 3-Faktor Ligation mit einem Ncol/Notl-HCV-Fragment, 
entsprechend den Nukleotidpositionen 342 bis 1968 des HCV-Genoms und mit einem Notl/Spel-Fragment, entspre- 
chend den Nukleotidpositionen 1968-9605 ligiert. Das entstandene Konstrukt, bei dem das vollstandige HCV-Leser- 
aster und die 3' NTR stromabwarts dem Luziferasegenfragment und der EMCV-IRES liegen, wurde danach mit Pmel 
und Spel restringiert und mit dem analog restringierten l 389 /NS3-37wt-Subgenomkonstrukt-Vektor ligiert. Dieses selek- 
tionierbare HCV-Genomkonstrukt ist in Fig. 4 dargestellt. 

(D) Herstellunq von den HCV-RNA-Konstrukten entsprechend en in-vitro-Trnaskripten 

[0062] Die vorstehend beschriebenen gereinigten Plasmid DNAs wurden mit Seal linearisiert und nach Phe- 
nol/Chloroform-Extraktion und Isopropanol-Prazipitation in eine In-vitro-Trankriptionsreaktion eingesetzt unter Verwen- 
dung der folgenden Komponenten: 80 mM HEPES, pH 7.5, 12,5 mM MgCI 2 , 2 mM Spermidin, 40 mM Dithiothreitol, 2 
mM von jedem NTR 1 Einheit RNasin/|xl, 50 ng/ml restringierte DNA und ca. 2 Einheiten/^l T7 RNA Polymerase. Nach 
2 Std. bei 37°C wurde die Halfte der Menge an T7 Polymerase zugegeben und der Reaktionsansatz weitere 2h inku- 
biert. Zur Entfernung von DNA wurde die Mischung mit saurem Phenol extrahiert (U. Kedzierski, J.C. Porte, 1991 , Bio 
Techniques 10, 210), mit Isopropanol prazipitiert, das Pellet in Wasser gelost und mit DNase (2 Einheiten pro ng DNA) 
fur 60 Min. bei 37°C inkubiert. Nach anschlieBender Extraktion mit saurem Phenol, saurem Phenol/Chloroform und 
Chloroform und Isopropanol- Prazipitation wurde die geloste RNA mittel optischer Dichtemessungen quantifiziert und 
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ihre Unversehrtheit mittels Formaldehyd-Agarose-Gelelektrophorese uberpruft. 
Beispiel 2 : Transfektionsexperimente mit der Hepatomazellinie Huh-7 

[0063] Bei samtlichen Transfektionsexperimenten wurde sorgfaltig darauf geachtet, dal3 jegliche Matrizen-DNA 
zuvor entfernt worden war, um zu vermeiden, daB solche DNA in transf izierte Zellen integrieren und diesen unabhangig 
von einer HCV-Replikation eine Neomycin-Resistenz vermitteln konnte. Deshalb wurde im AnschluB an die in-vitro- 
Transkription ( Beispiel 1 D)die Reaktionsmischung mit 2 Einheiten DNasepro jig DNA fur 60 Min. bei 37°C behandelt 
und mit saurem Phenol, saurem Phenol/Chloroform und Chloroform extrahiert. Vor der Verwendung fur die Transfektion 
wurde die prazipitierte RNA mittels Formaldehyd Agarose Gel Elektrophorese analysiert. 

[0064] Es wurden drei separate Transfektionsxperimente mit der hoch differenzierten humanen Hepatomazellinie 
Huh-7 (gemaB Nakabayashi et al. 1982, Cancer Res. 42, 3858) durchgefuhrt. Dabei wurde jeweils 15 |ig RNA in 8 x 
10 s Huh-7-Zellen mit Hilfe der Elektroporation eingebracht und diese Zellen anschlieBend in Kulturschalen von 10 cm 
Durchmesser ausgesat. 24 Stunden nach der Aussaat wurde Neomycin (= G418) in einer Endkonzentration von 1 
mg/ml zugegeben. Das Kulturmedium wurde zweimal pro Woche gewechselt. Nach 3 - 5 Wochen waren kleine Kolo- 
nien erkennbar, die isoliert und unter den gleichen Kulturbedingungen passagiert wurden. 

[0065] Die ZellWone, die im Verlauf des ersten Experiments erhalten wurden, wurden isoliert und subpassagiert. 
Wahrend dieser Prozedur starben die meisten Klone und die Endausbeute betrug nur noch 9 Klone von Zellen, die mit 
den parentalen HCV-Subgenom-Konstrukten transfiziert worden waren und 1 Klon (Klone 8-1) von Zellen, die mit 
einem defekten HCV-Genom-Konstrukt, namlich einer defekten NS2-3' HCV-RNA transfiziert worden waren. AuBer 
einer verkurzten Verdopplungszeit und dem gelegentlichen Auftreten von irregular geformten Zellen wurden keine 
bestandigen morphologischen Unterschiede zwischen diesen 9 Zellklonen und dem einen Zellklon (Klon 8-1) oder den 
parentalen Huh-7 Zellen gefunden. 

[0066] Die Hauptkriterien fur funktionierende HCV-Genomkonstrukte sind die Bildung von viraler RNA mit korrekter 
GroBe und die Abwesenheit von (integrierter) Plasmid DNA, die eine G418-Resistenz iibertragen bzw. vermitteln 
konnte. 

[0067] Um die HCV-RNA in den Huh-7-Zellen zu bestimmen, wurde die Gesamt-RNA isoliert und mittels des gan- 
gigen Northern-Blot Verfahrens unter Verwendung einer Plusstrang-spezrfischen Ribosonde (= RNA-Sonde) analy- 
siert. HierfQr wurde von den jeweiligen Zellklonen Gesamt-RNA nach der Methode von Chomczynski und Sacchi 1987, 
Anal. Biochem. 162, 156 isoliert, und 10 jig RNA, was dem Gesamt-RNA-Gehalt von 0,5 - 1 x 10 6 Zellen entspricht, 
mittels denaturierender Formaldehyd-Agarose-Gelelektrophorese aufgetrennt (Spuren 3 bis 12 der Fig. 1 B). Als Gro- 
Benmarker mit authentischer Sequenz wurden gleichzeitig 10 9 in-vitro-Transkripte (ivtr.), die zu den l 389 /NS2-3'/wt Oder 
den l 389 /NS3-37wt Replikon-RNAs korrespondieren, mit aufgetrennt (Spur 1 bzw. Spur 2). Dieaufgetrennte RNA wurde 
auf Nylon-Membranen transferiert und mit radioaktiv markieiter Plusstrang-spezifischer RNA-Sonde, die komplemen- 
tar zu dem kompletten NPT-Gen und der HCV-IRES von Nukleotid 377 bis Nukleotid 1 war, hybridisiert. Die Positionen 
der HCV-spezifischen RNAs (Pfeile) und der 28S rRNA sind rechts von Spur 12 angegeben, die GroBen (Anzahlen der 
Nukleotide) der RNA-Marker sind links von Spur 1 angegeben. Die RNA Marker-Fragmente enthalten HCV-Sequenzen 
und hybridisieren deshalb mit der Ribosonde (= RNA-Sonde) Die Ergebnisse dieser Analyse sind in Fig. 1 B darge- 
stellt. 

[0068] Mit Ausnahme des mit dem defekten HCV-Genom-Konstrukt transfizierten Klons 8-1 , lieferten alle Zellklone 
homogene HCV-RNAs korrekter Lange (ca. 8640 Nukleotide im Fall des NS2-3' und ca. 7970 Nukleotide im Fall des 
NS3-3' Replikons). Dieser Befund ist ein Indiz dafur, daB die funktionalen Replikons bzw. die funktionalen HCV-Genom- 
Konstrukte die G418 Resistenz iibertragen. Um auszuschlieBen, daB die G418 Resistenz auf eine Plasmid-DNA 
zuriickzufiihren ist, die in das Genom der Huh-7 Wirtszelle integriert ist und unter der Kontrolle eines zellularen Promo- 
tors transkribiert wird, wurde von jedem Klon die DNA mittels einer NPT-Gen-spezifischen PCR untersucht. Hierbei 
wurde aus den selektierten Huh-7-Zellklonen die DNA mittels Verdau mit Proteinase K (40ng/ml, 1h, 37°C) in 
10mMTris, pH7,5, 1mM EDTA, 0,5% SDS und anschlieBender Extraktion mit Phenol, Phenol/Chloroform und Isopro- 
panolprazipitation isoliert. Das DNA-Prazipitat wurde in 10 mM Tris (pH 7,5) und 1 mM EDTA gelost und 1 Stunde mit 
Rnase A inkubiert. Im AnschluB an eine Phenol/Chloroform Extraktion und Ethanol Prazipitation wurde 1 ng DNA, ent- 
sprechend 4 - 8 x 10 4 Zellen, mittels PCR unter Einsatz NPT-Gen-spezifischer Primer (5'-TCAAGACCGACCTG 
TCCGGTGCCC-3' und 5'-CTTGAGCCTGGCGAACAGTTCGGC-3') analysiert und ein DNA-Fragment bestehend aus 
379 NuWeotiden erzeugt. Die Spezifitat des PCR-Produkts wurde mittels Southern Blot Verfahren nachgewiesen, 
wobei ein Digoxigenin-markiertes DNA Fragment eingesetzt wurde, das zu dem NPT-Gen korrespondiert. Als Positiv- 
Kontrollen (zum Nachweis etwa vorhandener kontaminierender NuWeinsauren) wurde das PCR-Verfahren mit 10 7 
Plasmid Molekulen oder 1 ng DNA aus einer BHK Zellinie, die stabil mit einem Neomycin-Resistenz-Gen transfiziert 
war, durchgefuhrt, und als Negativ-Kontrolle wurde die PCR mit denselben Reagenzien aber ohne zugesetzte DNA 
durchgefuhrt. 

Die Ergebnisse dieser Untersuchung sind in Fig. 1 C dargestellt. Die Spuren 1 und 2 reprasentieren die Positiv-Kontrol- 
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len, Spur 13 reprasentiert die Negativ-Kontrolle. Die Zahlenangaben links der Spur 1 bezeichnen die GroBe der 
Nukleotid-Marker-Molekiile. AuBer in Klon 7-3 (Fig. 1C, Spur 3), der von Zellen nach Transfektion mit einem NS2-3' 
Replikon/NS2-3'HCV-Genom-Konstrukt stammt, und in Klon 8-1 (Fig. 1C, Spur 12), der von Zellen nach Transfektion 
mit einem defekten HCV-Genom-Konstrukt stammt, war in keinem Zellklon eine NPT-DNA nachweisbar. Dieser Befund 

5 ist ein weiteres Indiz dafiir, daB die G418 Resistenz der meisten Klone durch die replizierende HCV-RNA vermittelt 
wurde. Aber auch unabhangig von diesen Ergebnissen ist es unwahrscheinlich, daB HCV-RNAs mit korrekter GroBe 
von integrierter Plasmid DNA erzeugt wird, denn die fur die in-vitro-Transkription verwendeten Plasmide enthalten 
weder einen eukaryontischen Promotor noch ein Polyadenylierungssignal. Im Fall des Klons 7-3 ist die Resistenz des- 
halb hochst wahrscheinlich sowohl durch das HCV-RNA-Konstrukt bzw. die replizierende HCV-RNA als auch durch 

w eine integrierte NPT DNA Sequenz vermittelt worden, wahrend die Resistenz der Zellen von Klon 8-1 ausschlieBlich 
auf die integrierte Plasmid DNA zuriickzufuhren ist. 

[0069] Urn zu bestatigen, daB die G41 8 Resistenz von einer autonom replizierenden HCV-RNA vermittelt ist, wurde 
der Klon 9-13 (Fig. 1 B, Spur 11) weiteren Tests unterworfen. Klon 8-1, der integrierte Kopien des NPT-Gens tragt, 
wurde uberall als Negativkontrolle eingesetzt. Mit dem Ziel, die Anwesenheit von NPT-DNA im Klon 9-13 rigoros aus- 

15 zuschlieBen, wurde eine PCR durchgefiihrt, die den Nachweis von < 1000 NPT-Gen-Kopien in ~ 40.000 Zellen erlaubt. 
Das Ergebnis dieser PCR ist in Fig. 2A dargestellt. Im einzelnen wurde bei dieser PCR wie folgt verfahren: 
Es wurden jeweils 10 6 - 10 2 Plasmid Molekule (l 377 /NS3-3/wt) entweder direkt (Spuren 7-11) oder nach Zugabe von 
jeweils 1 ug 9-13 DNA (Spuren 2 - 6) in dem Test eingesetzt. Die Spezifitat der amplifizierten DNA Fragment wurde mit- 
tels Southern Blot unter Verwendung einer NPT-spezifischen Sonde bestimmt. Eine PCR ohne DNA-Sonde wurde als 

20 Negativ-Kontrolle durchgefiihrt (Spur 12). 

Selbst mit dieser sensitiven Methode wurde in einem ^g DNA des Zellklons 9-13 keine Plasmid DNA gefunden (Spur 
1). Urn die Menge an HCV Plus- und Minusstrang RNAs in diesen Zellen abzuschatzen, wurde eine Verdunnungsreihe 
von Gesamt-RNA mit dem Northern-Blot-Verfahren unter Verwendung einer Plus- oder Minusstrang-spezifischen 
radioaktiv markierten Ribosonde (= RNA-Sonde) analysiert. Hierfur wurden jeweils 8, 4 oder 2 ug Gesamt-RNA, die 

25 aus den Zellklonen 9-13 und 8-1 isoliert worden waren, parallel zu bekannten Mengen analoger in-vitro-Transkripte mit 
Plus- oder Minusstrang-Polaritat (Kontroll-RNAs) im Northern-Blot-Verfahren analysiert und anschlieBend einer Hybri- 
disierung unterworfen. Die Hybridisierung wurde mit einer Plusstrang-spezifischen Ribosonde, die das komplette NPT- 
Gen und die HCV-IRES abdeckte ('plusstrand', obere Bildtafel), oder mit einer Minusstrang-spezifischen RNA-Sonde, 
die zu der NS3-Sequenz komplementar war ('minusstrand', untere Bildtafel) durchgefiihrt. Die Pfeile markieren die 

30 Positionen von Replikon-RNA. Die Ergebnisse dieser Analyse sind in Fig. 2 B dargestellt. 

Im Fall des Plusstrangs wurden ca. 10 s Kopien/|ig Gesamt-RNA nachgewiesen, was 1000 - 5000 HCV-RNA-Molekulen 
pro Zelle entspricht, wahrend die Menge an Minusstrang- RN A 5- bis 10-fach niedriger war. Dieses Ergebnis stimmt mit 
der Annahme uberein, daB die Minusstrang RNA die replikative Zwischenform bzw. Zwischenkopie ist, die als Vorlage 
fur die Synthese der Plusstrang Molekule dient. 

35 Da die Reaktion im wesentlichen von der viralen RNA-abhangigen RNA Polymerase katalysiert wird, sollte die Syn- 
these der HCV-RNAs resistent gegen Dactinomycin sein, einem Antibiotikum, das selektiv die RNA-Synthese von 
DNA-Matrizen inhibiert, nicht jedoch die RNA-Synthese von RNA-Matrizen. Urn diese Vermutung zu bestatigen, wur- 
den Zellen mit [ 3 H] Uridin in Anwesenheit von Dactinomycin inkubiert, die radioaktiv markierten RNAs extrahiert, mittels 
denaturierender Agarose-Gel-Elektrophorese aufgetrennt und mit Hilfe eines handelsublichen Bio-lmagers unter Ver- 

40 wendung einer [ 3 H]-sensitiven Bildplatte analysiert. Hierfur wurden jeweils ca. 5 x 10 5 Zellen der Klone 9-13 und 8-1 
mit 100 n Ci [ 3 H]Uridin fur 16 Std. in Abwesenheit (-) oder Gegenwart (+) von 4 ng/ml Dactinomycin (Dact) inkubiert. 
Im AnschluG an diese Markierungsreaktion wurde die Gesamt-RNA prapariert und mittels Formaldehyd-Agarose-Gel- 
Elektrophorese analysiert. In den beiden ersten Spuren ist nur 1/10 der Gesamt-RNA dargestellt. Die radioaktiv mar- 
kierte RNA wurden mit einem BAS-2500 Bio-lmager (Firma Fuji) sichtbar gemacht. 

45 Die Ergebnisse dieser Analyse sind in Fig. 2 C dargestellt. In Ubereinstimmung mit dem Inhibitor-Profil der NS5B Poly- 
merase (Behrensetal., 1996, EMBOJ. 15, 12 und Lohmann etal., 1997, J Virol. 71, 8416) war die Replikation der HCV 
RNA nicht durch Dactinomycin beeinf luBt worden, wahrend die Synthese von zellularer RNA gehemmt worden war. Urn 
die Identitat der viralen RNA zu bestatigen, wurde eine RT-PCR zur Reklonierung der replizierten Sequenzen durchge- 
fiihrt. Die Sequenzanalyse der reklonierten RNA zeigte, daB die RNA in dem Klon 9-13 HCV-spezifisch ist und mit dem 

so transfizierten Transkript des HCV-Konstrukts l 377 /NS3-37wt ubereinstimmt. 

[0070] Zur Analyse der viralen Proteine wurden die betreffenden Zellen zunachst metabolisch mit [ 35 S] Methio- 
nin/Cystein radioaktiv markiert, anschlieBend lysiert und danach die HCV-spezifischen Proteine mittels Immunoprazi- 
pitation aus den Zell-Lysaten isoliert. Die Ergebnisse dieser Analysen sind in Fig. 3 A dargestellt. Im einzelnen wurde 
dabei wie folgt verfahren: Zellen der Zellklone 9-13 (wt) und 8-1 (A) waren durch Behandlung fur 16 Stunden mit einer 

55 dem Fachmann gelaufigen und im Handel erhaltlichen Protein-Markierungs-Mischung (z.B. NEN Life Science) metabo- 
lisch radioaktiv markiert worden. Mittels Immunoprazipitation (IP) unter nicht-denaturierenden Bedingungen (z.B. nach 
Bartenschlager et al., 1995, J. Virol. 69, 7519) und unter Verwendung von drei verschiedenen Antiseren (3/4, 5A, 5B, 
gemaB Markierung am oberen Ende der Spuren 1 bis 12) waren die HCV-spezifischen Proteine vom Zell-Lysat abge- 
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trennt worden.. Die Immunokomplexe wurden mittels Tricine SDS-PAGE analysiert und mittels Autoradiographie sicht- 
bar gemacht. Urn authentische GroBenmarker zu erhalten, wurdedas homologe Replikonkonstrukt l 3 77/NS3-3'/wt einer 
transienten Expression mit dem Vaccinia Virus T7-Hybrid System in Huh-7 Zellen unterworfen. Die dabei erhaltenen 
Produkte waren als GroBenmarker (Spuren 7 - 9) parallel zu den Zellen der Klone 9-13 und 8-1 behandelt worden. 
5 Identifizierte HCV-Proteine sind am linken Rand von Spur 1 markiert, die Molekulargewichte (in Kilodalton) sind am 
rechten Rand von Spur 9 angegeben. Es ist anzumerken, dal3 das verwendete NS3/4-spezifische Antiserum ('3/4') 
bevorzugt mit NS4A und NS4B reagiert, was zu einer Unterreprasentation von NS3 fiihrt. 

[0071] Alle viralen Antigene waren eindeutig nachweisbar und ihre apparenten Molekulargewichte zeigten keine 
Abweichungen gegenuber denjenigen, die nach transienter Expression desselben bicistronischen HCV-RNA-Kon- 

10 strukts in den ursprunglichen Huh-7 Zellen ermittelt wurden. Urn die subzellulare Verteilung der viralen Antigene zu 
bestimmen, wurde eine Immunofluoreszenz-Nachweisieaktion unter Einsatz von NS3- und NS5A-spezifischen Antise- 
ren durchgefuhrt (z.B. nach Bartenschlager et al„ 1995, J. Virol. 69, 7519). Hierfur wurden Zellen der Klone 9-13 (wt) 
und 8-1 (A) 24 Std. nach dem Aussaen auf Deckglasern mit Methanol/Azeton fixiert und mit polyklonalen NS3- Oder 
NS5A-spezifischen Antiseren inkubiert. Die gebundenen Antikorper wurden mit einem kommerziell erhaltlichen FITC- 

15 konjugierten Anti-Kaninchen-Antiserum sichtbar gemacht. Zur Unterdriickung unspezifischer Fluoreszenzsignale wur- 
den die Zellen mit dem Farbstoff 'Evans Blue' gegengefarbt. 

[0072] Die Ergebnisse dieses Nachweistests sind in Fig. 3 B dargestellt. Mit beiden Antiseren war eine starke Fluo- 
reszenz im Zytoplasma nachweisbar. Die NS5A-spezifischen Antiseren fuhrten auBerdem zu einer schwachen Zell- 
kern-Fluoreszenz, was darauf hindeutet, daB zumindest kleine Mengen dieses Antigens auch zum Zellkern gelangen. 

20 Die generell dominierende Prasenz der viralen Antigene im Zytoplasma ist jedoch ein starkes Indiz dafur, daB die HCV- 
RNA Replikation im Zytoplasma stattfindet — so wie das bei den meisten RNA-Viren der Fall ist. 
[0073] Diese Ergebnisse belegen War, daB mit dem hier beschriebenen Versuchsansatz der Aufbau eines Zellkul- 
tursystems fur das HCV gelungen ist, dessen Effizienz alles bisher bekannte urn GroBenordnungen ubersteigt und erst- 
malig den Nachweis viraler NuWeinsauren und Proteine mit konventionellen und bewahrten biochemischen Methoden 

25 erlaubt. Erst diese Effizienz erlaubt iiberhaupt detailierte Untersuchungen der HCV-Pathogenese, genetische Analysen 
verschiedener HCV-Funktionen und ein genaues Studium der Virus-/Wirtszellwechselwirkungen, wodurch sich neue 
Ansatzpunkte fur die Entwicklung einer antiviralen Therapie definieren lassen. 

Beispiel 3 : Transfektion von Huh-7 Zellen mit HCV-Genomkonstrukten 

30 

[0074] Huh-7 Zellen werden wie in Beispiel 2 beschrieben transf iziert und selektioniert, wobei hier jedoch selektio- 
nierbare Konstrukte verwendet werden, die das vollstandige Virusgenom enthalten. Die erhaltenen Zellklone werden 
analog dem Beispiel 2 mittels PCR auf Abwesenheit von HCV-DNA untersucht und die produktive Replikation der HCV- 
RNA wird danach mittels Northern Blot, [ 3 H]Uridinmarkierung in Anwesenheit von Dactinomycin, Nachweis der viralen 

35 Proteine bzw. Antigene vorzugsweise mit Hilfe des Western Blots, der Immunoprazipitation Oder der Immunfluoreszenz 
nachgewiesen. Im Gegensatz zu den im Beispiel 2 beschriebenen Ansatzen lassen sich mit dem hier beschriebenen 
Konstrukt auBerdem vollstandige und sehr wahrscheinlich infektJOse Viren erhalten, was bei den dort (in Beispiel 2) 
beschriebenen Subgenomkonstrukten nicht der Fall ist. Diese Viren, die in der Zelle und dem Zellkulturiiberstand vor- 
handen sind, werden beispielsweise mittels Ultrazentrifugation, Immunprazipitation Oder Fallung mit Polyethylenglykol 

40 konzentriert und alle exogenen, d.h. nicht im Viruspartikel eingebauten NuWeinsauren werden mittels Inkubation mit 
NuWeasen (RNase, DNase, Mikrococusnuklease) verdaut. Auf diese Weise lassen sich alle kontaminierenden NuWe- 
insauren, die nicht im schutzenden Viruspartikel enthalten sind, entfernen. Die geschutzte virale RNA wird nach Inak- 
tivierung der NuWeasen, beispielsweise mittels Inkubation mit Proteinase K in einem SDS-haltigen Puffer durch 
Extraktion mit Phenol und Phenol/Chloroform isoliert und mittels Northern Blot Oder RT-PCR unter Verwendung HCV- 

45 spezifischer Primer nachgewiesen. Auch in diesem Versuchsansatz ist die Kombination des beschriebenen HCV-Kon- 
sensusgenoms mit einem Selektionsmarker entscheidend fur die effiziente Produktion von viraler RNA, viralem Protein 
und damit von HCV-Partikeln. 

Beispiel 4 : Herstellung und Anwendung eines HCV- RNA Konstrukts, bei dem das Resistenzgen iiber ein Ribo- 
50 zym bzw. eine Erkennungsstelle fur ein Ribozym mit der HCV-Subgenom-Sequenz verbunden ist. 

[0075] Es wird ein HCV-RNA-Konstrukt gemaB Beispiel 1 oder Beispiel 3 hergestellt, bei dem ein Antibiotikumresi- 
stenzgen Ciber ein Ribozym bzw. eine Erkennungsstelle fur ein Ribozym mit der HCV-RNA-Sequenz verbunden ist. Sol- 
che KonstruWe sind in Fig. 7 schematisch dargestellt. Huh-7 Zellen werden wie in Beispiel 2 beschrieben mit diesem 
55 HCV-RNA-Konstrukt transf iziert. Nach der Transfektion in die Zellen erfolgt zunachst die SeleWion mit dem entspre- 
chenden Antibiotikum. In den dabei erhaltenen Zellklonen wird das einklonierte Ribozym aktiviert oder, im Fall eines 
KonstruWs, das eine Erkennungsstelle fur ein Ribozym fragt, wird das Ribozym in die Zelle eingeschleust (z.B. mittels 
Transfektion eines Ribozymkonstrukts oder Infektion mit einem viralen ExpressionsveWor, in den das entsprechende 
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Ribozym eingesetzt wurde). In beiden Fallen wird durch die ribozymvermittelte Spaltung das Resistenzgen von der 
HCV-RNA-Sequenz abgetrennt. Das Ergebnis ist im Fall des HCV-Genom-Konstrukts ein authentisches HCV-Genom 
ohne Resistenzgen, das zur Bildung authentischer infektidser Viruspartikel befahigt ist. Im Fall des HCV-Subgenom- 
Konstrukts entsteht ein HCV-Replikon ohne Resistenzgen. 

Beispiel 5 : Kotransfektion eines HCV-RNA-Konstrukts mit einem separaten Luziferase-Transfektionskonstrukt 

[0076] Es wird ein HCV-RNA-Konstrukt gemaG Beispiel 1 (A) oder Beispiel 3 Oder Beispiel 4 hergestellt. Parallel 
dazu wird ein Transfektionskonstrukt hergestellt, welches das Luziferasegen umfaBt, wobei dieses Luziferasegen ver- 
mittels einer ersten Nukleotidsequenz, die fur eine HCV-Protease- (z.B. NS3-Protease-) Spaltungsstelle kodiert, mit 
einer zweiten Nukleotidsequenz, die fur ein anderes Protein oder einen Teil eines anderen Proteins kodiert, verbunden 
ist. HCV-RNA-Konstrukt und Transfektionskonstrukt werden in beliebige Wirtszellen, vorzugsweise Hepatomazellen, 
insbesondere Huh-7-Zellen, eingeschleust. Dies kann auf die in Beispiel 2 beschriebene Art und Weise geschehen. 
Das Produkt des modifizierten Luziferasegens ist ein Luziferase-Fusionsprotein, in dem die Luziferase auf Grund der 
Fusion mit dem Fremdanteil inaktiv ist. In transf izierten Zellen mit hoher HCV-Replikation wird das Fusionsprotein, das 
ja eine Schnittstelle fur eine HCV-Protease enthalt, gespalten und damit die aktive Form der Luziferase freigesetzt, die 
sich durch luminometrische Messung bestimmen laBt. Wird die Replikation des HCV-RNA-Konstrukts gehemmt, wird 
das Fusionsprotein nicht gespalten und keine aktive Luziferase freigesetzt. Infolgedessen ist die quantitative Bestim- 
mung der Luziferase ein MaB fur die Replikation des HCV-Subgenom-Konstrukts. Anstelle des Luziferasegens kann 
ebensogut ein anderes Reportergen verwendet werden, das in analoger Weise modifiziert ist, so daB seine Expression 
von der Virusreplikation abhangt, obwohl dieses Reportergen nicht Bestandteil des HCV-Subgenom-Konstrukts ist. Es 
kann auch ein zellulares Protein, welches durch die HCV-Proteine oder Nukleinsaure inaktiviert oder aktiviert wird, als 
sogenannter Surrogatmarker verwendet werden. In diesem Fall ist die Expression bzw. Aktivitat dieses Surrogatmark- 
ers ein MaB fur die Replikation der viralen DNA. 

Beispiel 6 : Herstellung von HCV-Subgenom-Konstrukten mit integrierten Fremdgenen zur Verwendung als 
leberzellspezif ische Genfahren fur die Gentherapie 

[0077] Diese rekombinanten und selektionierbaren HCV-Subgenom-Konstrukte werden in trans-komplementie- 
rende Helferzellinien transfiziert, d.h. in Zellinien, die induzierbar oder konstitutiv die fehlenden Funktionen (beispiels- 
weise die Strukturproteine) exprimieren. Zellklone, die ein funktionelles HCV-Subgenom-Konstrukt enthalten, lassen 
sich durch entsprechende Selektion etablieren. Die von der Wirtszelle exprimierten Virus-Strukturproteine erlauben die 
Bildung von Viruspartikeln, in die die RNA der HCV-Subgenom-Konstrukte eingeschleust wird. Das Ergebnis sind also 
virus-ahnliche Partikel, die ein erfindungsgemaBes HCV-Subgenom-Konstrukt einschlieBlich des einWonierten Fremd- 
gens enthalten und die dieses mittels Infektion auf andere Zellen iibertragen konnen. Ein Beispiel fur ein solches Kon- 
strukt ist in Fig. 8 dargestellt. Es besteht auch die Moglichkeit, das hier beschriebene erfindungsgemaBe HCV- 
Subgenom-Konstrukt mit integriertem Fremdgen direkt als Expressionsvektor einzusetzen. Dabei wird analog dem vor- 
genannten Verfahren vorgegangen, allerdings mit dem Unterschied, daB Zellinien transfiziert waden, die keine trans- 
komplementierenden Faktoren exprimieren. In diesem Fall dient das HCV-Konstrukt also lediglich als 
Expressionsvektor. 

Beispiel 7 : Herstellung zellkultur-adaptierter HCV-RNA-Konstrukte 
(A) Isolationsverfahren 

[0078] Fur die Bestimmung adaptiver Mutationen und die Herstellung zellkultur-adaptierter HCV-RNA-Konstrukte 
wurde wie folgt verfahren: Zellen wurden mit einem HCV-RNA-Konstrukt wie unter den Beispielen 1 und 2 beschrieben 
transfiziert und G418-resistente Zellklone hergestellt. Zur Bestimmung der Replikationskompetenz (darunter wird in 
diesem Zusammenhang die Anzahl G418-resistenter Zellklone verstanden, die pro Mikrogramm transfizierter HCV- 
RNA bzw. HCV-RNA-Konstrukt erhalten wird) wurde exemplarisch die Gesamt-RNA aus einem der Zellklone, genannt 
9-13 (Fig. 1B, Spur 11) isoliert und die Menge der darin enthaltenen HCV-RNA mittels Northern-blot wie in Fig. 2 B 
beschrieben bestimmt. 10 Mikrogramm der Gesamt-RNA, die ca. 10 9 Molekule HCV-RNA enthielt, wurde anschlieBend 
per Elektroporation in naive Huh-7 Zellen eingeschleust (Fig. 9). Parallel dazu wurden 10 9 in vitro Transkripte der ana- 
logen neo-HCV-RNA, die mit isolierter Gesamt-RNA aus nai'ven Huh-7 Zellen auf eine Gesamt-RNA-Menge von 10 \ig 
aufgefullt worden war, in naive Huh-7 Zellen transfiziert. Nach Selektion mit G418 wurde die Anzahl der Zellkolonien, 
ausgedruckt in 'colony forming units (cfu) pro Mikrogramm RNA' in den beiden Ansatzen bestimmt. Bei einer Konzen- 
tration von 500 ng/ml G418 im Selektionsmedium betrug die Zahl der Kolonien, die mit der in der isolierten Gesamt- 
RNA enthaltenen HCV-RNA erhalten wurde, ca. 100.000 cfu pro Mikrogramm HCV-RNA. Dagegen wurden mit dersel- 
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ben Menge in vitro transkribierter HCV-RNA nur 30 - 50 Kolonien erhalten. Dieses Ergebnis belegt, da(3 die spezif ische 
Infektiositat der HCV-RNA, dieausden Zellklonen isoliert wurde, ca. 1.000 ■ 10.000-fach hoher istalsdie Infektiositat 
der analogen in vitro Transkripte. Das methodische Vorgehen ist in Fig. 9 dargestellt. 

[0079] Mit Hilfe der 'long-distance RT-PCR' wurde die HCV-RNA aus der Gesamt-RNA der 9-13 Zellen amplifiziert, 
5 die PCR-Amplifikate kloniert und zahlreiche Klone sequenziert. Ein Vergleich der Sequenzen dieser reklonierten RNAs 
mit der Sequenz der RNA, die ursprunglich in die naiiven Huh-7 Zellen eingeschleust wurde ergab, dal3 die reklonierten 
RNAs zahlreiche Aminosaureaustausche besaRen, die Qber die gesamte HCV-Sequenz verteilt waren (Fig. 10). Sfi\- 
Fragmente dieser reklonierten Mutanten wurden im Austausch gegen das analoge Sr/I-Fragment des urspriinglichen 
Replikonkonstrukts in dieses eingefuhrt und RNAs der jeweiligen Mutanten wurden in naive Huh-7 Zellen einge- 
10 schleust. Nach Selektion mit G418 wurde dann fur jede HCV-RNA-MutantedieZahldergebildeten Kolonien bestimmt. 
Wahrend mit der Ausgangs-RNA nur 30 - 50 Kolonien pro Mikrogramm RNA erhalten wurde war die Koloniezahl bei 
zwei der reklonierten Varianten deutlich hoher (Fig. 10). Im Fall der HCV-RNA-Konstrukte 9-131 und 9-13C betrug die 
spezifische Infektiositat 100 - 1.000 cfu pro Mikrogramm RNA und beim 9-13F Replikon sogar 1.000 - 10.000 cfu pro 
Mikrogramm RNA. Diese Ergebnisse zeigen, da(3 die Aminosaureaustausche in dem analysierten NS3-5B-Bereich der 
15 Mutanten 9-131, 9-13C und insbesondere 9-13F zu einer deutlichen Erhohung der Replikationskompetenz fuhrten. 
DemgegenLiber waren alle anderen HCV-RNA-Konstrukte (9-13 A, B, G, H und K) nicht mehr replikationskompetent, 
enthielten also letale Mutationen. 

[0080] Zwecks Beantwortung der Frage, welche der Aminosaureaustausche im 9-13F-Konstrukt zur Steigerung 
der Replikation fuhrten, wurden die Austausche einzeln Oder in Kombination in das Ausgangs-HCV-RNA-Konstrukt ein- 

20 gefuhrt und die entsprechenden RNAs in naive Huh-7 Zellen eingeschleust. Das Ergebnis der Transfektionen mit die- 
sen RNAs ist in Tabelle 1 zusammengefaGt. Daraus wird ersichtlich, dal5 im vorliegenden Beispiel die hohe 
Replikationskompetenz durch mehrere Mutationen bedingt ist. Den groRten Beitrag leisten die Aminosaureaustausche 
in den HCV-RNA-Abschnitten NS5A und NS4B. Auch die einzelnen Austausche in der NS3-Region leisten einen Bei- 
trag, der moglicherweise auf einem Synergismus dieser Einzelaustausche beruht. 

25 Diese Befunde belegen, da(3 es durch die G418-Selektion der Zellen, die mit den neo-HCV-RNA-Konstrukten transfi- 
ziert wurden, zur Anreicherung solcher HCV-RNAs kam, die eine deutlich hohere Replikationskompetenz hatten. Mit 
dem hier beschriebenen Versuchsansatz lassen sich HCV-RNA-Konstrukte mit sehr unterschiedlicher Replikationseffi- 
zienz selektionieren. Je hoher die Konzentration des Antibiotikums in dem Selektionsmedium ist, in/auf dem die HCV- 
RNA-Konstrukt-haltigen Zellen zwecks Selektion kultiviert werden, desto hoher mul3 der Grad an adaptiven Mutationen 

30 und damit die Replikationseffizienz in den betreffenden HCV-RNA-Konstrukten sein, damit die Zellen auswachsen kon- 
nen. Werden die Selektionen mit niedrigeren Antibiotikum-Konzentrationen durchgefuhrt, konnen auch solche Zellen 
Clberleben und sich vermehren, die im Vergleich geringer adaptive Mutationen und eine weniger hohe Replikationseffi- 
zienz aufweisen. 

Das bisher beschriebene HCV-RNA-Konstrukt 9-13F, das mehrere adaptive Mutationen enthielt, hatte eine erwiesener- 

35 maBen hohere Replikationseffizienz als die parentale HCV-RNA. Urn HCV-RNAs mit noch hoherer Replikation in Zell- 
kultur zu erhalten, wurde die HCV-RNA, die in der Gesamt-RNA eines ausgewahlten Zellklons enthalten war, mehrfach 
in nai'ven Huh-7 Zellen passagiert. Dieser ausgewahlte Zellklon, genanrrt 5-15, wurde durch Transfektion mit dem HCV- 
RNA-Konstrukt l 389 /NS3-3' erhalten (Fig. 1). Er entspricht weitgehend dem Zellklon 9-13, der durch Transfektion mit 
einem HCV-RNA-Konstrukt hergestellt wurde, das eine urn 22 NuWeotide kurzere HCV-IRES besaB (l 3 77/NS3-3'; Fig. 

40 1). 10 Mikrogramm Gesamt-RNA, isoliert aus dem Zellklon 5-15, wurden mittels Elektroporation in naiive Huh-7 Zellen 
eingeschleust und die Zellen einer Selektion mit 1 mg/ml G418 unterzogen. Aus einem der so erzeugten Zellklone 
wurde wiederum Gesamt-RNA isoliert, in naive Huh-7 Zellen transfiziert und analog selektioniert. Dieser Vorgang 
wurde insgesamt viermal wiederholt. Nach der vierten Passage wurde aus einem Zellklon die Gesamt-RNA isoliert und 
die neo-HCV-RNA mit Hilfe der 'long-distance RT-PCR' amplifiziert. Das amplifizierte DNA-Fragment wurde mit dem 

45 Restriktionsenzym Sfil verdaut und in das Sfil-restringierte Ausgangskonstrukt l 389 /NS3-3' inseriert. Insgesamt wurden 
uber 1 00 DNA-Klone erhalten und zunachst mittels Restri ktionsverdau analysiert. In vitro transkribierte RNA von ca. 80 
dieser Klone wurde jeweils in naive Huh-7 eingeschleust und einer Selektion mit 500mg/ml G418 unterzogen. Von den 
80 untersuchten neo-HCV-RNA-Varianten erwiesen sich die allermeisten als replikationsdefekt. Bei zwei Mutanten, 
genannt 5.1 und 19, war die spezifische Infektiositat, ausgedrtickt als 'colony forming units' pro Mikrogramm RNA, 

so jedoch sehr deutlich erhoht (Tabelle 2). Durch mehrfache Passage der RNA in Zellkultur lassen sich offensichtlich HCV- 
RNAs herstellen, deren Replikationseffizienz aufgrund von Mutationen (sog. "adaptiven Mutationen) mehrere GroBen- 
ordnungen hoher ist als die der ursprunglich aus dem Patienten Honierten RNA. 

(B) Modif ikationsverfahren 

55 

[0081] Solche nach (A) erzeugtenn und identifizierten adaptiven Mutationen konnen in ein wenig replikationskom- 
petentes HCV-RNA-Konstrukt Cibertragen werden und fuhren zu einer massiven Steigerung der Replikation dieses 
Konstrukts. Diese Steigerung ist so hoch, da!3 damit nachweislich HCV-RNAs in Zellkultur zur Replikation gebracht 
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werden konnen, die kein selektierbares Markergen mehr besitzen. Fig. 12 zeigt einen Vergleich der Replikationseffizi- 
enz von HCV-RNAs, die entweder der Ausgangssequenz oder den adaptierten Sequenzen 9-1 3F bzw. 5.1 entspra- 
chen. Zwecks einfacher Messung wurde das neo-Gen entfernt und durch das Gen fur die Luziferase ersetzt. Als 
Negativkontrolle diente wiederum ein HCV-RNA-Konstrukt, das auf Grund einer inaktivierenden Mutation der NS5B 
RNA-Polymerase replikationsdefekt war. Schon 24 Stunden nach der Transfektion erkennt man einen deutlichen Unter- 
schied in der Luziferaseaktivitat zwischen der defekten RNA und den 9-13F bzw. 5.1-Konstrukten wahrend zwischen 
der defekten RNA (318 DN) und dem Ausgangs-RNA-Konstrukt (wt) das keine adaptiven Mutationen besaG, kaum ein 
Unterschied zu sehen war. Wahrend des gesamten Beobachtungszeitraums wurde die hochste Luziferaseaktivitat und 
damit die hochste Replikation mitder 5.1 -RNA erhalten. Diese Befunde belegen nicht nur die hohe Replikationseffizi- 
enz dieser RNA, sondern zeigen auch, daG es moglich ist, mit adaptierten HCV-RNA-Konstrukten ein Zellkultursystem 
aufzubauen, fur das die Anwesenheit eines selektierbaren Gens nicht mehr notwendig ist. Eine zusammenfassende 
Ubersicht der Nukleotid- und Aminosaureunterschiede zwischen dem Ausgangskonstrukt und den Mutanten 9-13F, 5.1 
und 19 ist in Tabelle 3 gegeben. 

Beispiel 8: Herstellung zellkultur-adaptierter HCV-RNA-Vollangengenome 

[0082] In den Beispielen 1 bis 7 wurde stets eine subgenomische HCV-RNA verwendet, der die gesamte Struktur- 
proteinregion von Core bis einschlieGlich p7 bzw. NS2 fehlte. Im vorliegenden Beispiel 8 wird gezeigt, daG es moglich 
ist, mit Hilfe der adaptierten NS3-5B-Sequenz ein HCV-Vollangengenom in Zellkultur zur Replikation zu bringen. Zu 
diesem Zweck wurde zunachst das Sfil-Fragment der gemaG Beispiel 7 hergestellten, hoch adaptierten HCV-RNA 5.1 
in ein selektionierbares HCV-Vollangengenom transferiert (Fig. 12). Dieses HCV-Genom wurde in naive Huh-7 Zellen 
transfiziert und einer Selektion mit unterschiedlichen G418-Konzentrationen unterzogen. In Abhangigkeit von der 
Selektionsstarke (der G418-Konzentration) wurde eine unterschiedlich groGe Zahl an Zellklonen erhalten (Fig. 12 B) . 
Im Vergleich dazu wurden mit dem unveranderten HCV-Vollangengenom, das keine-adaptiven Mutationen enthielt, 
keine Kolonien erhalten, ebenso mit der Negativkontrolle, die auf Grund einer inaktivierenden Mutation in der NS5B 
RNA-Polymerase replikationsdefekt war. Zum Nachweis dafiir, daG die so entstandenen Zellklone tatsachlich ein auto- 
nom replizierendes HCV-Vollangenkonstrukt enthielten, wurde Gesamt-RNAaus mehreren Zellklonen isoliert und mit- 
tels Northern-Blot analysiert. In alien Zellklonen war die Vollangen HCV-RNA eindeutig nachweisbar (Fig. 12). Damit ist 
eindeutig belegt, daG es mit Hilfe der an Zellkulturen adaptierten HCV-Sequenzen moglich ist, ein HCV-Vollangenge- 
nom herzustellen, das mit hoher Effizienz und autonom in einer Zellinie repliziert, d.h. es konnen mit dem erfindungs- 
gemaGen System auch adaptierte HCV-Vollangengenome hergestellt werden. Da dieser Klon daruber hinaus die 
vollstandige HCV-Sequenz besitzt, also auch die fur die Viruspartikelbildung notwendigen Strukturproteine, ist es mit 
diesem System moglich, groGe Mengen infektioser Viruspartikel in Zellkulturen herzustellen. Zum Nachweis dieser 
Viren werden zellfreie Uberstande von Zellen, die ein replizierendes HCV-Vollangengenom tragen, auf naive Huh-7 Zel- 
len gegeben und die so infizierten Zellen einer Selektion mit G41 8 unterzogen. Jeder Zellklon, der unter diesen Bedin- 
gungen auswachst, geht auf eine infizierte Zelle zurCick. Die Viren in den Zellkulturuberstanden von Zellen, die ein 
replizierendes HCV-Vollangengenom besitzen, konnen aber auch mit verschiedenen im Stand der Technik bekannten 
Verfahren wie Ultrazentrifugation oder Mikrodialyse angereichert und gereinigt werden und dann zur Infektion naiver 
Zellen verwendet werden. Mit diesem Verfahren ist eindeutig gezeigt, daG mit dem erfindungsgemaGen HCV-Zellkultur- 
system zellkultur-adaptierte HCV-Vollangengenome hergestellt werden konnen, die mit hoher Effizienz in Zellen repli- 
zieren und infektiose Viren produzieren. Diese konnen ebenfalls durch Infektion eines Versuchstiers, vorzugsweise 
dem Schimpansen, nachgewiesen werden. 

Beispiel 9: Herstellung von HCV-Vollangen-Konstrukten und HCV-Subgenom-Konstrukten mit Reportergen. 

[0083] Es wird ein HCV-RNA-Konstrukt hergestellt, bei dem anstelle des Antibiotikumresistenzgens ein Reporter- 
gen eingefCigt wird (Fig. 13). Dabei kann die Replikation anhand der Menge bzw. der Aktivitat des Reportergens bzw. 
Reportergenprodukts bestimmt werden. Das Reportergen ist vorzugsweise ein Gen aus der Gruppe der Luziferase- 
gene, dem CAT-Gen (Chloramphenicol-Acetyl-Transferase-Gen), dem lacZ-Gen (beta-Galaktosidasegen), dem GFP- 
Gen (green fluorescence protein Gen), dem GUS-Gen (Glukuronidasegen) oder dem SEAP-Gen (sezernierte alkali- 
sche Phosphatasegen). Diese Reportergene bzw. deren Produkte, namlich die entsprechenden Reporterproteine, kon- 
nen z.B. mittels Fluoreszenz, Chemilumineszenz, colorimetrisch oder mit Hilfe immunologischer Methoden (z.B. 
enzyme-linked immunosorbent assay, ELISA) bestimmt werden. Das Reportergen kann entweder von einer eigenen 
IRES exprimiert werden oder in Form eines Fusionsproteins, das entweder als solches aktiv ist oder mittels einer pro- 
teolytisch spaltbaren Aminosauresequenz so mit einem HCV-Protein verbunden ist, daG es von einer zellularen oder 
viralen (HCV-)Protease von diesem abgespalten wird. 
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Beispiel 10 : Herstellung von HCV-Vollangen-Konstrukten mit integrierten Fremdgenen zur Verwendung als 
leberzellspezif ische Genfahre fur die Gentherapie Oder als Expressionsvektor 

[0084] Das Konstrukt (Fig. 14) wird in Zellen eingeschleust und fuhrt dort zur Bildung von HCV-Viruspartikeln, die 
zur Infektion weiterer Zellen verwendet werden konnen. Da die Viruspartikel eine RNA mit einem Fremdgen enkapsi- 
diert haben kann dieses in den so irtfizierten Zellen zur Produktion des von diesem Fremdgen kodierten Proteins 
benutzt werden. Zellen, die mit dem Konstrukt transfiziert wurden, exprimieren ebenfalls das Fremdgen. 

Beispiel 11: Herstellung von monocistronischen HCV-RNA-Konstrukten, bei denen das Resistenzgenprodukt 
als Fusionsprotein mit dem HCV-Anteil exprimiert wird. 

[0085] Fur bestimmte Untersuchungen ist es von Vorteil, wenn das HCV-RNA-Konstrukt kein heterologes IRES- 
Element besitzt. Solche Untersuchungen sind beispielsweise die Bestimmung der Interleronresistenz. Wird eine Zelle, 
die ein HCV-RNA-Konstrukt besitzt, mit Interferon-alpha oder -beta inkubiert, kommt es zu einer Reduktion der Repli- 
kation der HCV-RNA. Zur Aufklarung des Wirkungsmechanismus ist es notwendig, dal3 das HCV-RNA-Konstrukt keine 
heterologe IRES besitzt, da ansonsten nicht bestimmt werden kann, ob die Interferon-vermittelte Hemmung durch eine 
Hemmung der HCV-Replikation oder durch eine Hemmung der heterologen IRES vermittelt wird. Deshalb werden Kon- 
strukte hergestellt, bei denen das Resistenzgen mit einem HCV-Protein fusioniert wird (Fig. 15). Entwederdas Fusions- 
protein ist als solches aktiv oder das Resistenzgenprodukt wird mittels einer proteolytisch spaltbaren 
Aminosauresequenz so mit einem HCV-Protein verbunden ist, daB es von einer zellularen oder viralen (HCV-)Protease 
von diesem abgespalten wird. 



Tabelle 1 



Spezifische Infektiositaten (cfu/ug RNA) der HCV-RNA-Konstrukte mit adaptiven Mutationen, die bei der 9-1 3F 
Mutante gefunden und in das parentale HCV-RNA-Konstrukt l 389 /NS3-3'/wt eingefuhrt wurden 


Ami nosaureaustausch 1 


HCV-Protein 


cfu/ug RNA 2 


kein 




30-60 


1283 arg -> gly 


NS3 


200 - 250 


1383 glu -> ala 


NS3 


30-60 


1577 lys->arg 


NS3 


30-60 


1609 lys -> glu 


NS3 


160 -300 


(1283 arg -> gly + 1383 glu ->ala+ 1577 lys -> arg + 1609 lys - 
>glu) 


NS3 


360 - 420 


1936 pro-> ser 


NS4B 


500 - 1000 


2163 glu -> gly 


NS5A 


1000-5000 


2330 lys -> glu 


NS5A 


30-60 


2442 ile -> val 


NS5B 


30-60 


alle zusammen 




5000 



1 Aminosaureaustausch im Polyprotein des HCV-lsolats Con-1 (EMBL-Genbank No. AJ238799); die Aminosauren sind im 
Dreibuchstabenkode angegeben. 

2 Colony forming units (Anzahl der Zellklone) bei einer Selektion von 500|ig/ml G418. 
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Tabelle 2 



Spezifische Infektiositaten (cfu/ug RNA) des parenta- 
len HCV-RNA-Konstrukls l 389 /NS3-3'/wt und der Vari- 
anten 9-1 3C, 9-131, 9-1 3F, 5.1 und 19. 


Transfizierte RNA-Vari- 
ante 


cfu/ng RNA 1 


Wildtyp 


30-50 


9-13 C 


100-1.000 


9-13 I 


100- 1.000 


9-13 F 


1.000- 10.000 


5.1 


50.000-100.000 


19 


50.000-100.000 



1 Colony forming units (Anzahl der Zellklone) bei einer 
Selektion von 500ug/ml G418. 
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Tabelle3: Nukleotid- und Aminosaureunterschiede zwischen dem parentalen HCV- 
RNA-Konstrukt I 3 «i/NS3-37wt und den Mutanten 9-131, 9-13F, 5.1 und 19 



HCVMutante 


Nukleotidposition 


Nukleotidaustausch 


AminosSureaustausc 
h 


9-131 


3685 


OT 


Pro > Leu 




4933 


C>T 


Thr > Met 




5249 


T>C 


. 




8486 


C>T 






8821 


OA 


Trp > stop 




8991 


OG 


Arg > Gly 




9203 


A>G 






9313 


T>C 


Phe > Ser 




9346 


T>C 


Val>Ala 


9-13 F 


3866 


C>T 






4188 


A>G 


Arg > Gly 




4489 


A>C 


Glu > Ala 




4562 


G> A 






4983 


T>C 






5071 


A> G 


Lys > Arg 




5166 


A>G 


Lys > Glu 




6147 


C>T 


Pro > Ser 




6829 


A>G 


Glu > Gly 




7329 


A>G 


Lys > Glu 




7664 


A>G 


He > Val 




8486 


C>T 






8991 


C>G 


Arg > Gly 


NK5.1 


4180 


C>T 


Thr > lie 




4679 


C>T 
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4682 


T > C 






5610 


C > A 


Leu > lie 




6437 


A>G 






6666 


A>G 


Asn> Asp 




6842 


C >T 






6926 


C > T 






6930 


T > C 


Ser > Pro 




7320 


C > T 


Pro > Ser 




7389 


A> G 


Lys > Glu 


NK19 


3946 


A>G 


Glu>Gly 




4078 


C > G 


Ala > Gly 




4180 


C >T 


Thr > lie 




4682 


T>C 






5610 


C > A 


Leu > He 




5958 


A>T 


Met > Leu 




6170 


T> A 






6596 


G> A 






6598 


C > G 


Ala > Gly 




6833 


C > T 






6842 


C > T 














7141 


A> G 


Glu > Gly 




7320 


C>T 


Pro > Ser 




7389 


A> G 


Lys > Glu 




7735 


G> A 


Ser > Asn 



[0086] Angegeben sind die Unterschiede der Nukleotid- und Aminosauresequenzen zwischen der Ausgangs-HCV- 
RNA-Sequenz Con 1 (EMBL-Genbank No. AJ238799) und denen der zellkulturadaptierten HCV-RNAs. Die Zahlen 
beziehen sich auf die Nukleotid- und Aminosaurepositionen des HCV-lsolats Con1. 
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SEQUENCE LISTING 

<110> Bartenschlager, Ralf 

<120> Hepatitis C Virus cell culture system 
<130> ba-1 



<160> 11 

<170> Patentln Ver. 2.1 

<210> 1 
<211> 11076 
<212> DNA 

<213> Hepatitis C Virus 
<400> 1 

gccagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactactg 60 
tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 
cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 180 
gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 
gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaacgt aacaccaacg ggcgcgccat gattgaacaa gatggattgc 420 
acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 480 
caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 540 
ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 600 
cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 660 
gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 720 
ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 780 
cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 840 
tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 900 
ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc 960 
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 1020 
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 1080 

ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 1140 
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagtttaaa 1200 
cagaccacaa cggtttccct ctagcgggat caattccgcc cctctccctc ccccccccct 1260 
aacgttactg gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt 1320 
tccaccatat tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg 1380 
acgagcattc ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc 1440 
gtgaaggaag cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt 1500 
tgcaggcagc ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta 1560 
taagatacac ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg 1620 
gaaagagtca aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag 1680 
gtaccccatt gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag 1740 
tcgaggttaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 1800 
cacgataata ccatgggcac gaatcctaaa cctcaaagaa aaaccaaacg taacaccaac 1860 
cgccgcccac aggacgtcaa gttcccgggc ggtggtcaga tcgtcggtgg agtttacctg 1920 
ttgccgcgca ggggccccag gttgggtgtg cgcgcgacta ggaagacttc cgagcggtcg 1980 
caacctcgtg gaaggcgaca acctatcccc aaggctcgcc agcccgaggg tagggcctgg 2040 
gctcagcccg ggtacccctg gcccctctat ggcaatgagg gcttggggtg ggcaggatgg 2100 
ctcctgtcac cccgtggctc tcggcctagt tggggcccca cggacccccg gcgtaggtcg 2160 
cgcaatttgg gtaaggtcat cgataccctc acgtgcggct tcgccgatct catggggtac 2220 
attccgctcg tcggcgcccc cctagggggc gctgccaggg ccctggcgca tggcgtccgg 2280 
gttctggagg acggcgtgaa ctatgcaaca gggaatctgc ccggttgctc cttttctatc 2340 
ttccttttgg ctttgctgtc ctgtttgacc atcccagctt ccgcttatga agtgcgcaac 2400 
gtatccggag tgtaccatgt cacgaacgac tgctccaacg caagcattgt gtatgaggca 2460 
gcggacatga tcatgcatac ccccgggtgc gtgccctgcg ttcgggagaa caactcctcc 2520 
cgctgctggg tagcgctcac tcccacgctc gcggccagga acgctagcgt ccccactacg 2580 
acgatacgac gccatgtcga tttgctcgtt ggggcggctg ctctctgctc cgctatgtac 2640 
gtgggagatc tctgcggatc tgttttcctc gtcgcccagc tgttcacctt ctcgcctcgc 2700 
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cggcacgaga cagtacagga ctgcaattgc tcaatatatc ccggccacgt gacaggtcac 2760 

cgtatggctt gggatatgat gatgaactgg tcacctacag cagccctagt ggtatcgcag 2820 

ttactccgga tcccacaagc tgtcgtggat atggtggcgg gggcccattg gggagtccta 2880 

gcgggccttg cctactattc catggtgggg aactgggcta aggttctgat tgtgatgcta 2940 

ctctttgccg gcgttgacgg gggaacctat gtgacagggg ggacgatggc caaaaacacc 3000 

ctcgggatta cgtccctctt ttcacccggg tcatcccaga aaatccagct tgtaaacacc 3060 

aacggcagct ggcacatcaa caggactgcc ctgaactgca atgactccot caacactggg 3120 

ttccttgctg ogctgttcta cgtgcacaag ttcaactcat ctggatgccc agagcgcatg 3180 

gccagctgca gccccatcga cgcgttcgct caggggtggg ggcccatcac ttacaatgag 3240 

tcacacagct cggaccagag gccttattgt tggcactacg caccccggcc gtgcggtatc 3300 

gtacccgcgg cgcaggtgtg tggtccagtg tactgcttca ccccaagccc tgtcgtggtg 3360 

gggacgaccg accggttcgg cgtccctacg tacagttggg gggagaatga gacggacgtg 3420 

ctgcttctta acaacacgcg gccgccgcaa ggcaactggt ttggctgtac atggatgaat 3480 

agcactgggt tcaccaagac gtgcgggggc cccccgtgta acatcggggg gatcggcaat 3540 

aaaaccttga cctgccccac ggactgcttc cggaagcacc ccgaggccac ttacaccaag 3600 

tgtggttcgg ggccttggtt gacacccaga tgcttggtcc actacccata caggctttgg 3660 

cactacccct gcactgtcaa ctttaccatc ttcaaggtta ggatgtacgt ggggggagtg 3720 

gagcacaggc tcgaagccgc atgcaattgg actcgaggag agcgttgtaa cctggaggac 3780 

agggacagat cagagcttag cccgctgctg ctgtctacaa cggagtggca ggtattgccc 3840 

tgttccttca ccaccctacc ggctctgtcc actggtttga tccatctcca tcagaacgtc 3900 

gtggacgtac aatacctgta cggtataggg tcggcggttg tctcctttgc aatcaaatgg 3960 

gagtatgtcc tgttgctctt cottcttotg gcggacgcgc gcgtctgtgc ctgcttgtgg 4020 

atgatgctgc tgatagctca agctgaggcc gccctagaga acctggtggt cctcaacgcg 4080 

gcatccgtgg ccggggcgca tggcattctc tccttcctcg tgttcttctg tgctgcctgg 4140 

tacatcaagg gcaggctggt ccctggggcg gcatatgccc tctacggcgt atggccgcta 4200 

ctcctgctcc tgctggcgtt accaccacga gcatacgcca tggaccggga gatggcagca 4260 

tcgtgcggag gcgcggtttt cgtaggtctg atactcttga ccttgtcacc gcactataag 4320 

ctgttcctcg ctaggctcat atggtggtta caatatttta tcaccagggc cgaggcacac 4380 

ttgcaagtgt ggatcccccc cctcaacgtt cgggggggcc gcgatgccgt catcctcctc 4440 

acgtgcgcga tccacccaga gctaatcttt accatcacca aaatcttgct cgccatactc 4500 

ggtccactca tggtgctcca ggctggtata accaaagtgc cgtacttcgt gcgcgcacac 4560 

gggctcattc gtgcatgcat gctggtgcgg aaggttgctg ggggtcatta tgtccaaatg 4620 

gctctcatga agttggccgc actgacaggt acgtacgttt atgaccatct caccccactg 4680 

cgggactggg cccacgcggg cctacgagac cttgcggtgg cagttgagcc cgtcgtcttc 4740 

tctgatatgg agaccaaggt tatcacctgg ggggcagaca ccgcggcgtg tggggacatc 4800 

atcttgggcc tgcccgtctc cgcccgcagg gggagggaga tacatctggg acoggcagac 4860 

agccttgaag ggcaggggtg gcgactcctc gcgcctatta cggcctactc ccaacagacg 4920 

cgaggcctac ttggctgcat catcactagc ctcacaggcc gggacaggaa ccaggtcgag 4980 

ggggaggtcc aagtggtctc caccgcaaca caatctttcc tggcgacctg cgtcaatggc 5040 

gtgtgttgga ctgtctatca tggtgccggc tcaaagaccc ttgccggccc aaagggccca 5100 

atcacccaaa tgtacaccaa tgtggaccag gacctcgtcg gctggcaagc gccccccggg 5160 

gcgcgttcct tgacaccatg cacctgcggc agctcggacc tttacttggt cacgaggcat 5220 

gccgatgtca ttccggtgcg ccggcggggc gacagcaggg ggagcctact ctcccccagg 5280 

cccgtctcct acttgaaggg ctcttcgggc ggtccactgc tctgcccctc ggggcacgct 5340 

gtgggcatct ttcgggctgc cgtgtgcacc cgaggggttg cgaaggcggt ggactttgta 5400 

cccgtcgagt ctatggaaac cactatgcgg tccccggtct tcacggacaa ctcgtcccct 5460 

ccggccgtac cgcagacatt ccaggtggcc catctacacg cccctactgg tagcggcaag 5520 

agcactaagg tgccggctgc gtatgcagcc caagggtata aggtgcttgt cctgaacccg 5580 

tccgtcgccg ccaccctagg tttcggggcg tatatgtcta aggcacatgg tatcgaccct 5640 

aacatcagaa ccggggtaag gaccatcacc acgggtgccc ccatcacgta ctccacctat 5700 

ggcaagtttc ttgccgacgg tggttgctct gggggcgcct atgacatcat aatatgtgat 5760 

gagtgccact caactgactc gaccactatc ctgggcatcg gcacagtcct ggaccaagcg 5820 

gagacggctg gagcgcgact cgtcgtgctc gccaccgcta cgcctccggg atcggtcacc 5880 

gtgccacatc caaacatcga ggaggtggct ctgtccagca ctggagaaat ccccttttat 5940 

ggcaaagcca tccccatcga gaccatcaag ggggggaggc acctcatttt ctgccattcc 6000 

aagaagaaat gtgatgagct cgccgcgaag ctgtccggcc tcggactcaa tgctgtagca 6060 

tattaccggg gccttgatgt atccgtcata ccaactagcg gagacgtcat tgtcgtagca 6120 

acggacgctc taatgacggg ctttaccggc gatttcgact cagtgatcga ctgcaataca 6180 

tgtgtcaccc agacagtcga cttcagcctg gacccgacct tcaccattga gacgacgacc 6240 

gtgccacaag acgcggtgtc acgctcgcag cggcgaggca ggactggtag gggcaggatg 6300 

ggcatttaca ggtttgtgac tccaggagaa cggccctcgg gcatgttcga ttcctcggtt 6360 

ctgtgcgagt gctatgacgc gggctgtgct tggtacgagc tcacgcccgc cgagacctca 6420 

gttaggttgc gggcttacct aaacacacca gggttgcccg tctgccagga ccatctggag 6480 

ttctgggaga gcgtctttac aggcctcacc cacatagacg cccatttctt gtcccagact 6540 

aagcaggcag gagacaactt cccctacctg gtagcatacc aggctacggt gtgcgccagg 6600 

gctcaggctc cacctccatc gtgggaccaa atgtggaagt gtctcatacg gctaaagcct 6660 
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acgctgcacg ggccaacgcc cctgctgtat aggctgggag ccgttcaaaa cgaggttact 6720 
accacacacc ccataaccaa atacatcatg gcatgcatgt cggctgacct ggaggtcgtc 6780 
acgagcacct gggtgctggt aggcggagtc ctagcagctc tggccgcgta ttgcctgaca 6840 
acaggcagcg tggtcattgt gggcaggatc atcttgtccg gaaagcoggc catcattccc 6900 
gacagggaag tcctttaccg ggagttcgat gagatggaag agtgcgcctc acacctccct 6960 
tacatcgaac agggaatgca gctcgccgaa caattcaaac agaaggcaat cgggttgctg 7020 
caaacagcca ccaagcaagc ggaggctgct gctcccgtgg tggaatccaa gtggcggacc 7080 
ctcgaagcct tctgggcgaa gcatatgtgg aatttcatca gcgggataca atatttagca 7140 
ggcttgtcca ctctgcctgg caaccccgcg atagcatcac tgatggcatt cacagcctct 7200 
atcaccagcc cgctcaccac ccaacatacc ctcctgttta acatcctggg gggatgggtg 7260 
gccgcccaac ttgctcctcc cagcgctgct totgctttcg taggcgccgg catcgctgga 7320 
gcggctgttg gcagcatagg ccttgggaag gtgcttgtgg atattttggc aggttatgga 7380 
gcaggggtgg caggcgcgct cgtggccttt aaggtcatga gcggcgagat gccctccacc 7440 
gaggacctgg ttaacctact ccctgctatc ctctcccctg gcgccctagt cgtcggggtc 7500 
gtgtgcgcag cgatactgcg tcggcacgtg ggcccagggg agggggctgt gcagtggatg 7560 
aaccggctga tagcgttcgc ttcgcggggt aaccacgtct cccccacgca ctatgtgcct 7620 
gagagcgacg ctgcagcacg tgtcactcag atcctctcta gtcttaccat cactcagctg 7680 
ctgaagaggc ttcaccagtg gatcaacgag gactgctcca cgccatgctc cggctcgtgg 7740 
ctaagagatg tttgggattg gatatgcacg gtgttgactg atttcaagac ctggctccag 7800 
tocaagctcc tgccgcgatt gccgggagtc ccottottct catgtcaacg tgggtacaag 7860 
ggagtctggc ggggcgacgg catcatgcaa aocacctgcc catgtggagc acagatcacc 7920 
ggacatgtga aaaacggttc catgaggatc gtggggccta ggacctgtag taacacgtgg 7980 
catggaacat tccccattaa cgcgtacacc acgggcccct gcacgccctc cccggcgcca 8040 
aattattcta gggcgctgtg gcgggtggct gctgaggagt acgtggaggt tacgcgggtg 8100 
ggggatttcc actacgtgac gggcatgacc actgacaacg taaagtgccc gtgtcaggtt 8160 
ccggcccccg aattcttcac agaagtggat ggggtgcggt tgcacaggta cgctccagcg 8220 
tgcaaacccc tcctacggga ggaggtcaoa ttcctggtcg ggctcaatca atacctggtt 8280 
gggtcacagc tcccatgcga gccogaaccg gaogtagcag tgctcacttc catgctcacc 8340 
gacccctccc acattacggc ggagacggct aagcgtaggc tggccagggg atctcccccc 8400 
tccttggcca gctcatcagc tagccagctg tctgcgcctt ccttgaaggc aacatgcact 8460 
acccgtcatg actccccgga cgctgacctc atcgaggcca acctcctgtg gcggcaggag 8520 
atgggcggga acatcacccg cgtggagtca gaaaataagg tagtaatttt ggactctttc 8580 
gagccgctcc aagcggagga ggatgagagg gaagtatccg ttccggcgga gatcctgcgg 8640 
aggtccagga aattccctcg agcgatgccc atatgggcac gcccggatta caaccctcoa 8700 
ctgttagagt cctggaagga cccggactac gtccctccag tggtacacgg gtgtccattg 8760 
ccgcctgcca aggcccctcc gataccacct ccacggagga agaggacggt tgtcctgtca 8B20 
gaatctaccg tgtcttctgc cttggcggag ctcgccacaa agaccttcgg cagctccgaa 8880 
tcgtcggccg tcgacagcgg cacggcaacg gcctctcctg accagccctc cgacgacggc 8940 
gacgcgggat ccgacgttga gtcgtactcc tccatgcccc cccttgaggg ggagccgggg 9000 
gatcccgatc tcagcgacgg gtcttggtct accgtaagcg aggaggctag tgaggacgtc 9060 
gtctgctgct cgatgtccta cacatggaca ggcgccctga tcacgccatg cgctgcggag 9120 
gaaaccaagc tgcccatcaa tgcactgagc aactctttgc tccgtcacca caacttggtc 9180 
tatgctacaa catctcgcag cgcaagcctg cggcagaaga aggtcacctt tgacagactg 9240 
caggtcctgg acgaccacta ccgggacgtg ctcaaggaga tgaaggcgaa ggcgtccaca 9300 
gttaaggcta aacttctatc cgtggaggaa gcctgtaagc tgacgccccc acattcggcc 9360 
agatctaaat ttggctatgg ggcaaaggac gtccggaacc tatccagcaa ggccgttaac 9420 
cacatccgct ccgtgtggaa ggacttgctg gaagacactg agacaccaat tgacaccacc 9480 
atcatggcaa aaaatgaggt tttctgcgtc caaccagaga aggggggccg caagccagct 9540 
cgccttatcg tattcccaga tttgggggtt cgtgtgtgcg agaaaatggc cctttacgat 9600 
gtggtctcca ccctccctca ggccgtgatg ggctcttcat acggattcca atactctcct 9660 
ggacagcggg tcgagttcct ggtgaatgcc tggaaagcga agaaatgccc tatgggcttc 9720 
gcatatgaca cccgctgttt tgactcaacg gtcactgaga atgacatccg tgttgaggag 9780 
tcaatctacc aatgttgtga cttggccccc gaagccagac aggccataag gtcgctcaca 9840 
gagcggcttt acatcggggg ccccctgact aattctaaag ggcagaactg cggctatcgc 9900 
cggtgccgcg cgagcggtgt actgacgacc agctgcggta ataccctcac atgttacttg 9960 
aaggccgctg cggcctgtcg agctgcgaag ctccaggact gcacgatgct cgtatgcgga 10020 
gacgaccttg tcgttatctg tgaaagcgcg gggacccaag aggacgaggc gagcctacgg 10080 
gccttcacgg aggctatgac tagatactct gccccccctg gggacccgcc caaaccagaa 10140 
tacgacttgg agttgataac atcatgctcc tccaatgtgt cagtcgcgca cgatgcatct 10200 
ggcaaaaggg tgtactatct cacccgtgac cccaccaccc cccttgcgcg qgctgcgtgg 10260 
gagacagcta gacacactcc agtcaattcc tggctaggca acatcatcat gtatgcgccc 10320 
accttgtggg caaggatgat cctgatgact catttcttct ccatccttct agctcaggaa 10380 
caacttgaaa aagccctaga ttgtcagatc tacggggcct gttactccat tgagccactt 10440 
gacctacctc agatcattca acgactccat ggccttagcg cattttcact ccatagttac 10500 
tctccaggtg agatcaatag ggtggcttca tgcctcagga aacttggggt accgcccttg 10560 
cgagtctgga gacatcgggc cagaagtgtc cgcgctaggc tactgtccca gggggggagg 10620 
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gctgccactt gtggcaagta cctcttcaac tgggcagtaa ggaccaagct caaactcact 10680 

ccaatcccgg ctgcgtccca gttggattta tccagctggt tcgttgctgg ttacagcggg 10740 

ggagacatat atcacagcct gtctcgtgcc cgaccccgct ggttcatgtg gtgcctactc 10800 

ctactttctg taggggtagg catctatcta ctccccaacc gatgaacggg gagctaaaca 10860 

ctccaggcca ataggccatc ctgttttttt cccttttttt ttttcttttt tttttttttt 10920 

tttttttttt tttttttttc tccttttttt ttcctctttt tttccttttc tttcctttgg 10980 

tggctccatc ttagccctag tcacggctag ctgtgaaagg tccgtgagcc gcttgactgc 11040 

agagagtgct gatactggcc tctctgcaga tcaagt 11076 
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<210> 2 
<211> 8637 
<212> DNA 

5 <213> Hepatitis C Virus 

<400> 2 

gccagccccc gattgggggc gacactcoac catagatcac tcccctgtga ggaactactg 60 
tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 
cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 180 
gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccccc 240 

10 gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 

gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaaggg cgcgccatga ttgaacaaga tggattgcac gcaggttctc 420 
cggccgcttg ggtggagagg ctattcggct atgactgggc acaacagaca atcggctgct 480 
ctgatgccgc cgtgttccgg ctgtcagcgo aggggcgccc ggttcttttt gtcaagaccg 540 
acctgtccgg tgccctgaat gaactgcagg acgaggcagc gcggctatcg tggctggcca 600 

}5 ogacgggcgt tccttgcgca gctgtgctcg acgttgtcac tgaagcggga agggactggc 660 

tgctattggg cgaagtgccg gggcaggatc tcctgtcatc tcaccttgct cctgccgaga 720 
aagtatccat catggctgat gcaatgcggc ggctgcatac gcttgatccg gctacctgcc 780 
cattcgacca ccaagcgaaa catcgcatcg agcgagcacg tactcggatg gaagccggtc 840 
ttgtcgatca ggatgatctg gacgaagagc atcaggggct cgcgccagcc gaactgttcg 900 
ccaggctcaa ggcgcgcatg cccgacggcg aggatctcgt cgtgacccat ggcgatgcct 960 
gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg attcatcgac tgtggccggc 1020 

20 tgggtgtggc ggaccgctat caggacatag cgttggctac ccgtgatatt gctgaagagc 1080 

ttggcggcga atgggctgac cgcttcctcg tgctttacgg tatcgccgct cccgattcgc 1140 
agcgcatcgc cttctatcgc cttcttgacg agttcttctg agtttaaaca gaccacaacg 1200 
gtttccctct agcgggatca attccgcccc tctccctccc ccccccctaa cgttactggc 1260 
cgaagccgct tggaataagg ccggtgtgcg tttgtctata tgttattttc caccatattg 1320 
ccgtcttttg gcaatgtgag ggcccggaaa cctggccctg tcttcttgac gagcattcct 1380 

25 aggggtcttt cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt gaaggaagca 1440 

gttcctctgg aagcttcttg aagacaaaca acgtctgtag cgaccctttg caggcagcgg 1500 
aaccccccac ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata agatacacct 1560 
gcaaaggcgg cacaacccca gtgccacgtt gtgagttgga tagttgtgga aagagtcaaa 1620 
tggctctcct caagcgtatt caacaagggg ctgaaggatg cccagaaggt accccattgt 1680 
atgggatctg atctggggcc tcggtgcaca tgctttacat gtgtttagtc gaggttaaaa 1740 
aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgataatacc 1800 

30 atggaccggg agatggcagc atcgtgcgga ggcgcggttt tcgtaggtct gatactcttg 1860 

accttgtcac cgcactataa gctgttcctc gctaggctca tatggtggtt acaatatttt 1920 
atcaccaggg ccgaggcaca cttgcaagtg tggatccccc ccctcaacgt tcgggggggc 1980 
cgcgatgccg tcatcctcct cacgtgcgcg atccacccag agctaatctt taccatcacc 2040 
aaaatcttgc tcgccatact ^ggtccactc dtggtgctcc aggclggtat aaccaaagtg 2100 
ccgtacttcg tgcgcgcaca cgggctcatt cgtgcatgca tgctggtgcg gaaggttgct 2160 

35 gggggtcatt atgtccaaat ggctctcatg aagttggccg cactgacagg tacgtacgtt 2220 

tatgaccatc tcaccccact gcgggactgg gcccacgcgg gcctacgaga ccttgcggtg 2280 
gcagttgagc ccgtcgtctt ctctgatatg gagaccaagg ttatcacctg gggggcagac 2340 
accgcggcgt gtggggacat catcttgggc ctgcccgtct ccgcccgcag ggggagggag 2400 
atacatctgg gaccggcaga cagccttgaa gggcaggggt ggcgactcct cgcgcctatt 2460 
acggcctact cccaacagac gcgaggccta cttggctgca tcatcactag cctcacaggc 2520 
cgggacagga accaggtcga gggggaggtc caagtggtct ccaccgcaac acaatctttc 2580 

40 ctggcgacct gcgtcaatgg cgtgtgttgg actgtctatc atggtgccgg ctcaaagacc 2640 

cttgccggcc caaagggccc aatcacccaa atgtacacca atgtggacca ggacctcgtc 2700 
ggctggcaag cgccccccgg ggcgcgttcc ttgacaccat gcacctgcgg cagctcggac 2760 
ctttacttgg tcacgaggca tgccgatgtc attccggtgc gccggcgggg cgacagcagg 2820 
gggagcctac tctcccccag gcccgtctcc tacttgaagg gctcttcggg cggtccactg 2880 
ctctgcccct cggggcacgc tgtgggcatc tttcgggctg ccgtgtgcac ccgaggggtt 2940 

45 gcgaaggcgg tggactttgt acccgtcgag tctatggaaa ccactatgcg gtccccggtc 3000 

ttcacggaca actcgtcccc tccggccgta ccgcagacat tccaggtggc ccatctacac 3060 
gcccctactg gtagcggcaa gagcactaag gtgcqggctg cgtatgcagc ccaagggtat 3120 
aaggtgcttg tcctgaaccc gtccgtcgcc gccaccctag gtttcggggc gtatatgtct 3180 
aaggcacatg gtatcgaccc taacatcaga accggggtaa ggaccatcac cacgggtgcc 3240 
cccatcacgt actccaccta tggcaagttt cttgccgacg gtggttgctc tgggggcgcc 3300 

5Q tatgacatca taatatgtga tgagtgccac tcaaotgact cgaccactat cctgggcatc 3360 

ggcacagtcc tggaccaagc ggagacggct ggagcgcgac tcgtcgtgct cgccaccgct 3420 
acgcctccgg gatcggtcac cgtgccacat ccaaacatcg aggaggtggc tctgtccagc 3480 
actggagaaa tcccctttta tggcaaagcc atccccatcg agaccatcaa gggggggagg 3540 
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cacctcattt tctgccattc caagaagaaa tgtgatgagc tcgccgcgaa gctgtccggc 3600 

ctcggactca atgctgtagc atattaccgg ggccttgatg tatccgtcat accaactagc 3660 

ggagacgtca ttgtcgtagc aacggacgct ctaatgacgg gctttaccgg cgatttcgac 3720 

tcagtgatcg actgcaatac atgtgtcacc cagacagtcg acttcagcct ggacccgacc 3780 

ttcaccattg agacgacgac cgtgccacaa gacgcggtgt cacgctcgca gcggcgaggc 3840 

aggactggta ggggcaggat gggcatttac aggtttgtga ctccaggaga acggccctcg 3900 

ggcatgttcg attcctcggt tctgtgcgag tgctatgacg cgggctgtgc ttggtacgag 3960 

ctcacgcccg ccgagacctc agttaggttg cgggcttacc taaacacacc agggttgccc 4020 

gtctgccagg accatctgga gttctgggag agcgtcttta caggcctcac ccacatagac 4080 

gcccatttct tgtcccagac taagcaggca ggagacaact tcccctacct ggtagcatac 4140 

10 caggctacgg tgtgcgccag ggctcaggct ccacctccat cgtgggacca aatgtggaag 4200 

tgtctcatac ggctaaagcc tacgctgcac gggccaacgc ccctgctgta taggctggga 4260 

gccgttcaaa acgaggttac taccacacao cccataacoa aatacatcat ggcatgoatg 4320 

tcggctgacc tggaggtcgt cacgagcaco tgggtgctgg taggcggagt cctagcagot 4380 

ctggccgcgt attgcctgac aacaggcagc gtggtcattg tgggcaggat catcttgtcc 4440 

ggaaagccgg ccatcattcc cgacagggaa gtcctttacc gggagttcga tgagatggaa 4500 

gagtgcgcct cacacctccc ttacatcgaa cagggaatgc agctcgccga acaattcaaa 4560 

:; cagaaggcaa tcgggttgct gcaaacagcc accaageaag cggaggctgc tgctcccgtg 4620 

gtggaatcca agtggcggac cctcgaagcc ttctgggcga agcatatgtg gaatttcatc 4680 

agcgggatac aatatttagc aggcttgtcc actctgcctg gcaaccccgc gatagcatca 4740 

ctgatggcat tcacagcctc tatcaccagc ccgctcacca cccaacatac cctcctgttt 4800 

aacatcctgg ggggatgggt ggccgcccaa cttgctcctc ccagcgctgc ttctgctttc 4860 

gtaggcgccg gcatcgctgg agcggctgtt ggcagcatag gccttgggaa ggtgcttgtg 4920 

20 gatattttgg caggttatgg agcaggggtg gcaggcgcgc tcgtggcctt taaggtcatg 4980 

agcggcgaga tgccctccac cgaggacctg gttaacctac tccctgctat cctctcccct 5040 

ggcgccctag tcgtcggggt cgtgtgcgca gcgatactgc gtcggcacgt gggcccaggg 5100 

gagggggctg tgcagtggat gaaccggctg atagcgttcg cttcgcgggg taaccacgtc 5160 

tcccccacgo actatgtgcc tgagagcgac gctgcagcac gtgtcactca gatcctctct 5220 

agtcttacca tcactcagct gctgaagagg cttcaccagt ggatcaacga ggactgctcc 5280 

acgccatgct ccggctcgtg gctaagagat gtttgggatt ggatatgcac ggtgttgact 5340 

25 gatttcaaga cctggctcca gtccaagctc ctgccgcgat tgccgggagt ccccttcttc 5400 

tcatgtcaac gtgggtacaa gggagtctgg cggggcgacg gcatcatgca aaccacctgc 5460 

ccatgtggag cacagatcac cggacatgtg aaaaacggtt ccatgaggat cgtggggcct 5520 

aggacctgta gtaacacgtg gcatggaaca ttccccatta acgcgtacac cacgggcccc 5580 

tgcacgccct ccccggcgcc aaattattct agggcgctgt ggcgggtggc tgctgaggag 5640 

tacgtggagg ttacgcgggt gggggatttc cactacgtga cgggcatgac cactgacaac 5700 

30 gtaaagtgcc cgtgtcaggt tccggccccc gaattcttca cagaagtgga tggggtgcgg 5760 

ttgcacaggt acgctccagc gtgcaaaccc ctcctacggg aggaggtcac attcctggtc 5820 

gggctcaatc aatacctggt tgggtcacag ctcccatgcg agcccgaacc ggacgtagca 5880 

gtgctcactt ccatgctcac cgacccctcc cacattacgg cggagacggc taagcgtagg 5940 

ctggccaggg gatctccccc ctccttggcc agctcatcag ctagccagct gtctgcgcct 6000 

tccttgaagg caacatgcac tacccgtcat gactccccgg acgctgacct catcgaggcc 6060 

aacctcctgt ggcggcagga gatgggcggg aacatcaccc gcgtggagtc agaaaataag 6120 

35 gtagtaattt tggactcttt cgagccgctc caagcggagg aggatgagag ggaagtatcc 6180 

gttccggcgg agatcctgcg gaggtccagg aaattccctc gagcgatgcc catatgggca 6240 

cgcccggatt agaaccctcc actgttagag tcctggaagg acgcggacta cgtccctcca 6300 

gtggtacacg ggtgtccatt gccgcctgcc aaggcccctc cgataccacc tccacggagg 6360 

aagaggacgg ttgtcctgtc agaatctacc gtgtcttctg ccttggcgga gctcgccaca 6420 

aagaccttcg gcagctccga atcgtcggcc gtcgacagcg gcacggcaac ggcctctcct 6480 

40 gaccagccct ccgacgacgg cgacgcggga tccgacgttg agtcgtactc ctccatgccc 6540 

ccccttgagg gggagccggg ggatcccgat ctcagcgacg ggtcttggtc taccgtaagc 6600 

gaggaggcta gtgaggacgt cgtctgctgc tcgatgtcct acacatggac aggcgccctg 6660 

atcacgccat gcgctgcgga ggaaaccaag ctgcccatca atgcactgag caactctttg 6720 

ctccgtcacc acaacttggt ctatgctaca acatctcgca gcgcaagcct gcggcagaag 6780 

aaggtcacct ttgacagact gcaggtcctg gacgaccact accgggacgt gctcaaggag 6840 

atgaaggcga aggcgtccac agttaaggct aaacttctat ccgtggagga agcctgtaag 6900 

45 ctgacgcccc cacattcggc cagatctaaa tttggctatg gggcaaagga cgtccggaac 6960 

ctatccagca aggccgttaa ccacatccgc tccgtgtgga aggacttgct ggaagacact 7020 

gagacaccaa ttgacaccac catcatggca aaaaatgagg ttttctgcgt ccaaccagag 7080 

aaggggggcc gcaagccagc tcgccttatc gtattcccag atttgggggt tcgtgtgtgc 7140 

gagaaaatgg ccctttacga tgtggtctcc accctccctc aggccgtgat gggctcttca 7200 

tacggattcc aatactctcc tggacagcgg gtcgagttcc tggtgaatgc ctggaaagcg 7260 

SO aagaaatgcc ctatgggctt cgcatatgac acccgctgtt ttgactcaac ggtcactgag 7320 

aatgacatcc gtgttgagga gtcaatctac caatgttgtg acttggcccc cgaagccaga 7380 

caggccataa ggtcgctcac agagcggctt tacatcgggg gccccctgac taattctaaa 7440 

gggcagaact gcggctatcg ccggtgccgc gcgagcggtg tactgacgac cagctgcggt 7500 
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aataccctca catgttactt gaaggccgct 
tgcacgatgc tcgtatgcgg agacgacctt 
gaggacgagg cgagcctacg ggccttcacg 
ggggacccgc ccaaaccaga atacgacttg 
tcagtcgcgc acgatgcatc tggcaaaagg 
ccccttgcgc gggctgcgtg ggagacagct 
aacatcatca tgtatgcgcc caccttgtgg 
tccatccttc tagctcagga acaacttgaa 
tgttactcca ttgagccact tgacctacct 
gcattttcac tccatagtta ctctccaggt 
aaacttgggg taccgccctt gcgagtctgg 
ctactgtccc agggggggag ggctgccact 
aggaccaagc tcaaactcac tocaatcccg 
ttcgttgctg gttacagcgg gggagacata 
tggttcatgt ggtgcctact cctactttct 
cgatgaacgg ggagctaaac actccaggcc 
tttttctttt tttttttttt tttttttttt 
ttttcctttt ctttcctttg gtggctccat 
gtccgtgagc cgcttgactg cagagagtgc 



gcggcctgtc gagctgcgaa gctccaggac 7560 
gtcgttatct gtgaaagcgc ggggacccaa 7620 
gaggctatga ctagatactc tgccccccct 7680 
gagttgataa catcatgctc ctccaatgtg 7740 
gtgtactatc tcacccgtga ccccaccacc 7800 
agacacactc cagtcaattc ctggctaggc 7860 
gcaaggatga tcctgatgac tcatttcttc 7920 
aaagccctag attgtcagat ctacggggcc 7980 
cagatcattc aacgactcca tggccttagc 8040 
gagatcaata gggtggcttc atgcctcagg 8100 
agacatcggg ccagaagtgt ccgcgctagg 8160 
tgtggcaagt acctcttcaa ctgggcagta 8220 
gctgcgtccc agttggattt atccagctgg 8280 
tatcacagcc tgtctcgtgc ccgaccccgc 8340 
gtaggggtag gcatctatct actccccaac 8400 
aataggccat cctgtttttt tccctttttt 8460 
tttttttttt ctcctttttt tttcctcttt 8520 
cttagcccta gtcacggcta gctgtgaaag 8580 
tgatactggc ctctctgcag atcaagt 8637 
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<210> 3 
<211> 8001 
<212> DNA 

<213> Hepatitis C Virus 
<400> 3 

gccagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactaotg 60 

tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 

cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 180 

gacgaccggg tcctttcttg gatcaacccg ctoaatgcct ggagatttgg gcgtgccccc 240 

gcgagaotgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 

gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 

ctcaaagaaa aaccaaacgt aacaccaacg ggcgcgccat gattgaacaa gatggattgc 420 

acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 460 

caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 540 

ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 600 

cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 660 

gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaocttg 720 

ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 780 

cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 840 

tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 900 

ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc 960 

atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ecgcttttct ggattcatcg 1020 

actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 1080 

ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 1140 

ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagtttaaa 1200 

cagaccacaa cggtttccet ctagcgggat caattccgcc cctctccctc ccccccccet 1260 

aacgttactg gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt 1320 

tccaccatat tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg 1380 

acgagcattc ctaggggtct ttcocctctc gccaaaggaa tgcaaggtct gttgaatgtc 1440 

gtgaaggaag cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt 1500 

tgcaggcagc ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta 1560 

taagatacac ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg 1620 

gaaagagtca aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag 1680 

gtaccccatt gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag 1740 

tcgaggttaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 1800 

cacgataata ccatggcgcc tattacggcc tactcccaac agacgcgagg cctacttggc 1860 

tgcatcatca ctagcctcac agqccgggac aggaaccagg tcgaggggga ggtccaagtg 1920 

gtctccaccg caacacaatc tttcctggcg acctgcgtca atggcgtgtg ttggactgtc 1980 

tatcatggtg ccggctcaaa gacccttgcc ggcccaaagg gcccaatcac ccaaatgtac 2040 

accaatgtgg accaggacct cgtcggctgg caagcgcccc ccggggcgcg ttccttgaca 2100 

ccatgcacct gcggcagctc ggacctttac ttggtcacga ggcatgccga tgtcattccg 2160 

gtgcgccggc ggggcgacag cagggggagc ctactctccc ccaggcccgt ctcctacttg 2220 

aagggctctt cgggcggtcc actgctctgc ccctcggggc acgctgtggg catctttcgg 2280 

gctgccgtgt gcacccgagg ggttgcgaag gcggtggact ttgtacccgt cgagtctatg 2340 

gaaaccacta tgcggtcccc ggtcttcacg gacaactcgt cccctccggc cgtaccgcag 2400 

acattccagg tggcccatct acacgcccct actggtagcg gcaagagcac taaggtgccg 2460 

gctgcgtatg cagcccaagg gtataaggtg cttgtcctga acccgtccgt cgccgccacc 2520 

ctaggtttcg gggcgtatat gtctaaggca catggtatcg accctaacat cagaaccggg 2580 

gtaaggacca tcaccacggg tgcccccatc acgtactcca cctatggcaa gtttcttgcc 2640 

gacggtggtt gctctggggg cgcctatgac atcataatat gtgatgagtg ccactcaact 2700 

gactcgacca ctatcctggg catcggcaca gtcctggacc aagcggagac ggctggagcg 2760 

cgactcgtcg tgctcgccac cgctacgcct ccgggatcgg tcaccgtgcc acatccaaac 2820 

atcgaggagg tggctctgtc cagcactgga gaaatcccct tttatggcaa agccatcccc 2880 

atcgagacca tcaagggggg gaggcacctc attttctgcc attccaagaa gaaatgtgat 2940 

gagctcgccg cgaagctgtc cggcctcgga ctcaatgctg tagcatatta ccggggcctt 3000 

gatgtatccg tcataccaac tagcggagac gtcattgtcg tagcaacgga cgctctaatg 3060 

acgggcttta ccggcgattt cgactcagtg atcgactgca atacatgtgt cacccagaca 3120 

gtcgacttca gcctggaccc gaccttcacc attgagacga cgaccgtgcc acaagacgcg 3180 

gtgtcacgct cgcagcggcg aggcaggact ggtaggggca ggatgggcat ttacaggttt 3240 

gtgactccag gagaacggcc ctcgggcatg ttcgattcct cggttctgtg cgagtgctat 3300 

gacgcgggct gtgcttggta cgagctcacg cccgccgaga cctcagttag gttgcgggct 3360 

tacctaaaca caccagggtt gcccgtctgc caggaccatc tggagttctg ggagagcgtc 3420 

tttacaggcc tcacccacat agacgcccat ttcttgtccc agactaagca ggcaggagac 3480 

aacttcccct acctggtagc ataccaggct acggtgtgcg ccagggctca ggctccacct 3540 
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ccatcgtggg accaaatgtg gaagtgtctc atacggctaa agcctacgct gcacgggcca 3600 

acgccccCgc tgtataggct gggagccgtt caaaacgagg ttactaccac acaccccata 3660 

accaaataca tcatggcatg catgtcggct gacctggagg tcgtcacgag cacctgggtg 3720 

ctggtaggcg gagtcctagc agctctggcc gcgtattgcc tgacaacagg cagcgtggtc 3780 

attgtgggca ggatcatctt gtccggaaag ccggccatca ttcccgacag ggaagtcctt 3840 

taccgggagt tcgatgagat ggaagagtgc gcctcacacc tcccttacat cgaacaggga 3900 

atgcagctcg ccgaacaatt caaacagaag gcaatcgggt tgctgcaaac agccaccaag 3960 

caagcggagg ctgctgctcc ogtggtggaa tccaagtggc ggaccctcga agccttctgg 4020 

gcgaagoata tgtggaattt catcagcggg atacaatatt tagcaggctt gtccactctg 4080 

cctggcaacc ccgcgatagc atcactgatg gcattcacag cctctatcac cagcccgctc 4140 

accacccaac ataccctcct gtttaacatc ctggggggat gggtggccgc ccaacttgct 4200 

cctcccagcg ctgcttctgc tttcgtaggc gccggcatcg ctggagcggc tgttggcagc 4260 

ataggccttg ggaaggtgct tgtggatatt ttggcaggtt atggagcagg ggtggcaggc 4320 

gcgctcgtgg cctttaaggt catgagcggc gagatgccct ccaccgagga cctggttaac 4380 

ctactccctg ctatcctctc occtggcgcc ctagtcgtcg gggtcgtgtg cgcagcgata 4440 

ctgcgtcggc acgtgggccc aggggagggg gctgtgcagt ggatgaaccg gctgatagcg 4500 

ttcgcttcgc ggggtaacca cgtctccccc acgcaotatg tgcctgagag cgacgctgca 4560 

gcacgtgtca ctcagatcct ctctagtctt accatcactc agctgctgaa gaggcttcac 4620 

cagtggatca acgaggactg ctccacgcca tgctccggct cgtggctaag agatgtttgg 4680 

gattggatat gcacggtgtt gactgatttc aagacctggc tccagtccaa gctcctgccg 4740 

cgattgccgg gagtcccctt cttctcatgt caacgtgggt acaagggagt ctggcggggc 4800 

gacggcatca tgcaaaccac ctgcccatgt ggagcacaga tcaccggaca tgtgaaaaac 4860 

ggttccatga ggatcgtggg gcctaggacc tgtagtaaca cgtggcatgg aacattcccc 4920 

attaacgcgt acaccacggg cccctgcacg occtcoccgg cgccaaatta ttctagggcg 4980 

ctgtggcggg tggctgctga ggagtacgtg gaggttacgc gggtggggga tttccactac 5040 

gtgacgggca tgaccactga caacgtaaag tgcccgtgtc aggttccggc ccccgaattc 5100 

ttcacagaag tggatggggt gcggttgcac aggtacgctc cagcgtgcaa acccctccta 5160 

cgggaggagg tcacattcct ggtcgggctc aatcaatacc tggttgggtc acagctccca 5220 

tgcgagcccg aaccggacgt agcagtgctc acttccatgc tcaccgaccc ctcccacatt 5280 

acggcggaga cggctaagcg taggctggcc aggggatctc ccccctcctt ggccagctca 5340 

tcagctagcc agctgtctgc gcottccttg aaggcaacat gcactacccg tcatgactcc 5400 

ccggacgctg acctcatcga ggccaacctc ctgtggcggc aggagatggg cgggaacatc 5460 

acccgcgtgg agtcagaaaa taaggtagta attttggact ctttcgagcc gctccaagcg 5520 

gaggaggatg agagggaagt atccgttccg gcggagatcc tgcggaggtc caggaaattc 5580 

cctcgagcga tgcccatatg ggcacgcccg gattacaacc ctccactgtt agagtcctgg 5640 

aaggacccgg actacgtccc tccagtggta cacgggtgtc cattgccgcc tgccaaggcc 5700 

cctccgatac cacctccacg gaggaagagg acggttgtcc tgtcagaatc taccgtgtct 5760 

tctgccttgg cggagctcgc cacaaagacc ttcggcagct ccgaatcgtc ggccgtcgac 5820 

agcggcacgg caacggcctc tcctgaccag ccctccgacg acggcgacgc gggatccgac 5880 

gttgagtcgt actcctccat gccccccctt gagggggagc cgggggatcc cgatctcagc 5940 

gacgggtctt ggtctaccgt aagcgaggag gctagtgagg acgtcgtctg ctgctcgatg 6000 

tcctacacat ggacaggcgc cctgatcacg ccatgcgctg cggaggaaac caagctgccc 6060 

atcaatgcac tgagcaactc tttgctccgt caccacaact tggtctatgc tacaacatct 6120 

cgcagcgcaa gcctgcggca gaagaaggtc acctttgaca gactgcaggt cctggacgac 6180 

cactaccggg acgtgctcaa ggagatgaag gogaaggcgt ccacagttaa ggctaaactt 6240 

ctatccgtgg aggaagcctg taagctgacg cccocacatt cggccagatc taaatttggc 6300 

tatggggcaa aggacgtccg gaacctatcc agcaaggccg ttaaccacat qcgctccgtg 6360 

tggaaggact tgctggaaga cactgagaca ccaattgaca ccaccatcat ggcaaaaaat 6420 

gaggttttct gcgtccaacc agagaagggg ggccgcaagc cagctcgcct tatcgtattc 6480 

ccagatttgg gggttcgtgt gtgcgagaaa atggcccttt acgatgtggt ctccaccctc 6540 

cctcaggccg tgatgggctc ttcatacgga ttccaatact ctcctggaca gcgggtcgag 6600 

ttcctggtga atgcctggaa agcgaagaaa tgccctatgg gcttcgcata tgacaccqgc 6660 

tgttttgact caacggtcac tgagaatgac atccgtgttg aggagtcaat ctaccaatgt 6720 

tgtgacttgg cccccgaagc cagacaggcc ataaggtcgc tcacagagcg gctttacatc 6780 

gggggccccc tgactaattc taaagggcag aactgcggct atcgccggtg ccgcgcgagc 6840 

ggtgtactga cgaccagctg cggtaatacc ctcacatgtt acttgaaggc cgctgcggcc 6900 

tgtcgagctg cgaagctcca ggactgcacg atgctcgtat gcggagacga ccttgtcgtt 6960 

atctgtgaaa gcgcggggac ccaagaggac gaggcgagcc tacgggcctt cacggaggct 7020 

atgactagat actctgcccc ccctggggac ccgcccaaac cagaatacga cttggagttg 7080 

ataacatcat gctcctccaa tgtgtcagtc gcgcacgatg catctggcaa aagggtgtac 7140 

tatctcaccc gtgaccccac cacccccctt gcgcgggctg cgtgggagac agctagacac 7200 

actccagtca attcctggct aggcaacatc atcatgtatg cgcccacctt gtgggcaagg 7260 

atgatcctga tgactcattt cttctccatc cttctagctc aggaacaact tgaaaaagcc 7320 

ctagattgtc agatctacgg ggcctgttac tccattgagc cacttgacct acctcagatc 7380 

attcaacgac tccatggcct tagcgcattt tcactccata gttactctcc aggtgagatc 7440 

aatagggtgg cttcatgcct caggaaactt ggggtaccgc ccttgcgagt ctggagacat 7500 
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cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 
aagctcaaac tcactccaat cccggctgcg 7620 
gctggttaca gcgggggaga catatatcac 7680 
atgtggtgcc tactcctact ttctgtaggg 7740 
acggggagct aaacactcca ggccaatagg 7800 
tttttttttt tttttttttt tttttttttt 7860 
ttttctttcc tttggtggct ccatcttagc 7920 
gagccgcttg actgcagaga gtgctgatac 7980 
8001 
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<210> 4 
<211> 7989 
<212> DNA 

s <213> Hepatitis C Virus 

<400> 4 

gccagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactactg 60 
tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 
cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 160 
gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccccc 240 

10 gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 

gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaaggg cgcgccatga ttgaacaaga tggattgcac gcaggttctc 420 
cggccgcttg ggtggagagg ctattcggct atgactgggc acaacagaca atcggctgct 480 
ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc ggttcttttt gtcaagaccg 540 
acctgtccgg tgccctgaat gaactgcagg acgaggcagc goggctatcg tggctggcca 600 
cgacgggcgt tccttgcgca gctgtgctcg acgttgtcac tgaagcggga agggactggc 660 
tgctattggg cgaagtgccg gggcaggatc tcctgtcatc tcaccttgct cctgccgaga 720 
aagtatccat catggctgat gcaatgcggc ggctgcatac gcttgatccg gctacctgcc 780 
cattcgacca ccaagcgaaa catcgcatcg agcgagcacg tactcggatg gaagccggtc 840 
ttgtcgatca ggatgatctg gacgaagagc atcaggggct cgcgccagcc gaactgttcg 900 
ccaggctcaa ggcgcgcatg cccgacggcg aggatctcgt cgtgacccat ggcgatgcct 960 
gcttgccgaa tatcatggtg gaaaatggcc gcttttctgg attcatcgac tgtggccggc 1020 

20 tgggtgtggc ggaccgctat caggacatag cgttggctac ccgtgatatt gctgaagagc 1080 

ttggcggcga atgggctgac cgcttcctcg tgctttacgg tatcgccgct cccgattcgc 1140 
agcgcatcgc cttctatcgc cttcttgacg agttcttctg agtttaaaca gaccacaacg 1200 
gtttccctct agcgggatca attccgcccc totocctccc ccccccctaa cgttactggc 1260 
cgaagccgct tggaataagg ccggtgtgcg tttgtctata tgttattttc caccatattg 1320 
ccgtcttttg gcaatgtgag ggcccggaaa cctggccctg tcttcttgac gagcattcct 1380 

25 aggggtcttt cccctctcgc caaaggaatg caaggtctgt tgaatgtcgt gaaggaagca 1440 

gttcctctgg aagcttcttg aagacaaaca acgtctgtag cgaccctttg caggcagcgg 1500 
aaccccccac ctggcgacag gtgcctctgc ggccaaaagc cacgtgtata agatacacct 1560 
gcaaaggcgg cacaacccca gtgccacgtt gtgagttgga tagttgtgga aagagtcaaa 1620 
tggctctcct caagcgtatt caacaagggg ctgaaggatg cccagaaggt accccattgt 1680 
atgggatctg atctggggcc tcggtgcaca tgctttacat gtgtttagtc gaggttaaaa 1740 
aacgtctagg ccccccgaac cacggggacg tggttttcct ttgaaaaaca cgataatacc 1800 

30 atggcgccta ttacggccta ctcccaacag acgcgaggcc tacttggctg catcatcact 1860 

agcctcacag gccgggacag gaaccaggtc gagggggagg tccaagtggt ctccaccgca 1920 
acacaatctt tcctggcgac ctgcgtcaat ggcgtgtgtt ggactgtcta tcatggtgcc 1980 
ggctcaaaga cccttgccgg cccaaagggc ccaatcaccc aaatgtacac caatgtggac 2040 
caggaccLcg tcggctggca agcgcccccc ggggcgcgtt ccttgacacc atgcacctgc 2100 
ggcagctcgg acctttactt ggtcacgagg catgccgatg tcattccggt gcgccggcgg 2160 

35 ggcgacagca gggggagcct actctccccc aggcccgtct cctacttgaa gggctcttcg 2220 

ggcggtccac tgctctgccc ctcggggcac gctgtgggca tctttcgggc tgccgtgtgc 2280 
acccgagggg ttgcgaaggc ggtggacttt gtacccgtcg agtctatgga aaccactatg 2340 
cggtccccgg tcttcacgga caactcgtcc cctccggccg taccgcagac attccaggtg 2400 
gcccatctac acgcccctac tggtagcggc aagagcacta aggtgccggc tgcgtatgca 2460 
gcccaagggt ataaggtgct tgtcctgaac ccgtccgtcg ccgccaccct aggtttcggg 2520 
gcgtatatgt ctaaggcaca tggtatcgac cctaacatca gaaccggggt aaggaccatc 2580 

40 accacgggtg cccccatcac gtactccacc tatggcaagt ttcttgccga cggtggttgc 2640 

tctgggggcg cctatgacat cataatatgt gatgagtgcc actcaactga ctcgaccact 2700 
atcctgggca tcggcacagt cctggaccaa gcggagacgg ctggagcgcg actcgtcgtg 2760 
ctcgccaccg ctacgcctcc gggatcggtc accgtgccac atccaaacat cgaggaggtg 2820 
gctctgtcca gcactggaga aatccccttt tatggcaaag ccatccccat cgagaccatc 2880 
aaggggggga ggcacctcat tttctgccat tccaagaaga aatgtgatga gctcgccgcg 2940 

45 aagctgtccg gcctcggact caatgctgta gcatattacc ggggccttga tgtatccgtc 3000 

ataccaacta gcggagacgt cattgtcgta gcaacggacg ctctaatgac gggctttacc 3060 
ggcgatttcg actcagtgat cgactgcaat acatgtgtca cccagacagt cgacttcagc 3120 
ctggacccga ccttcaccat tgagacgacg accgtgccac aagacgcggt gtcacgctcg 3180 
cagcggcgag gcaggactgg taggggcagg atgggcattt acaggtttgt gactccagga 3240 
gaacggccct cgggcatgtt cgattcctcg gttctgtgcg agtgctatga cgcgggctgt 3300 

5Q gcttggtacg agctcacgcc cgccgagacc tcagttaggt tgcgggctta cctaaacaca 3360 

ccagggttgc ccgtctgcca ggaccatctg gagttctggg agagcgtctt tacaggcctc 3420 
acccacatag acgcccattt cttgtcccag actaagcagg caggagacaa cttcccctac 3480 
ctggtagcat accaggctac ggtgtgcgcc agggctcagg ctccacctcc atcgtgggac 3540 
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caaatgtgga agtgtctcat acggctaaag cctacgctgc acgggccaac gcccctgctg 3600 

tataggctgg gagccgttca aaacgaggtt actaccacac acoccataac caaatacatc 3660 

atggcatgca tgtcggctga cctggaggtc gtcacgagca cctgggtgct ggtaggcgga 3720 

gtcctagcag ctctggccgc gtattgcctg acaacaggca gcgtggtcat tgtgggcagg 3780 

atcatcttgt ccggaaagcc ggccatcatt cccgacaggg aagtccttta ccgggagttc 3840 

gatgagatgg aagagtgcgc ctcacacctc ccttacatcg aacagggaat gcagctcgcc 3900 

gaaoaattca aacagaaggc aatcgggttg ctgcaaacag ccaccaagca agcggaggct 3960 

gotgctcccg tggtggaatc caagtggcgg accctcgaag ccttctgggc gaagcatatg 4020 

tggaatttca tcagcgggat acaatattta gcaggcttgt ccactctgcc tggcaacccc 4080 

gcgatagcat cactgatggc attcacagcc tctatcacca gcccgctcac cacccaacat 4140 

accctcctgt ttaacatcct ggggggatgg gtggccgccc aacttgctcc tcccagcgct 4200 

gcttctgctt tcgtaggcgc cggcatcgct ggagcggctg ttggcagcat aggccttggg 4260 

aaggtgcttg tggatatttt ggcaggttat ggagcagggg tggcaggcgc gctcgtggcc 4320 

tttaaggtca tgagcggcga gatgccctcc accgaggacc tggttaacct actccctgct 4380 

atcctctcoc ctggcgccot agtcgtcggg gtcgtgtgcg cagcgatact gcgtcggcac 4440 

gtgggcccag gggagggggc tgtgcagtgg atgaaccggc tgatagcgtt cgcttcgcgg 4500 

ggtaaocacg tctoccccac gcactatgtg cctgagagcg acgctgcagc acgtgtcact 4560 

cagatcctct ctagtcttac catcactcag ctgctgaaga ggcttcacca gtggatcaac 4620 

gaggactgct ccacgccatg ctccggctcg tggctaagag atgtttggga ttggatatgc 4680 

acggtgttga ctgatttcaa gacctggctc cagtccaagc tcctgccgcg attgccggga 4740 

gtccccttct tctcatgtca acgtgggtac aagggagtct ggcggggcga cggcatcatg 4800 

caaaccacct gcccatgtgg agcacagatc accggacatg tgaaaaacgg ttccatgagg 4860 

atcgtggggc ctaggacctg tagtaacacg tggcatggaa cattccccat taacgcgtac 4920 

accacgggcc cctgcacgcc ctccccggcg ccaaattatt ctagggcgct gtggcgggtg 4980 

gctgctgagg agtacgtgga ggttacgcgg gtgggggatt tccactacgt gacgggcatg 5040 

accactgaca acgtaaagtg cccgtgtcag gttccggccc ccgaattctt cacagaagtg 5100 

gatggggtgc ggttgcacag gtacgctcca gcgtgcaaac ccctcctacg ggaggaggtc 5160 

acattcctgg tcgggctcaa tcaatacctg gttgggtcac agctcccatg cgagcccgaa 5220 

ccggacgtag cagtgctcac ttccatgctc accgacccct cccacattac ggcggagacg 5280 

gctaagcgta ggctggccag gggatctccc ccctccttgg ccagctcatc agctagccag 5340 

ctgtotgcgc cttccttgaa ggcaacatgc actaocogtc atgactcccc ggacgctgac 5400 

ctcatcgagg ccaacotcct gtggcggcag gagatgggcg ggaacatcac ccgcgtggag 5460 

tcagaaaata aggtagtaat tttggactct ttcgagccgc tccaagcgga ggaggatgag 5520 

agggaagtat ccgttccggc ggagatcctg cggaggtcca ggaaattccc tcgagcgatg 5580 

cccatatggg cacgcccgga ttacaaccct ccactgttag agtcctggaa ggacccggac 5640 

tacgtccctc cagtggtaca cgggtgtcca ttgccgcctg ccaaggcccc tccgatacca 5700 

cctccacgga ggaagaggac ggttgtcctg tcagaatcta ccgtgtcttc tgccttggcg 5760 

gagctcgcca caaagacctt cggcagctcc gaatcgtcgg ccgtcgacag cggcacggca 5820 

acggcctotc ctgaccagcc ctccgacgac ggcgacgcgg gatccgacgt tgagtcgtao 5880 

tcctccatgc ccccccttga gggggagccg ggggatcccg atctcagcga cgggtcttgg 5940 

tctaccgtaa gcgaggaggc tagtgaggac gtcgtctgct gctcgatgtc ctacacatgg 6000 

acaggcgccc tgatcacgcc atgcgctgcg gaggaaacca agcLgcccaL caatgcactg 6060 

agcaactctt tgctccgtca ccacaacttg gtctatgcta caacatctcg cagcgcaagc 6120 

ctgcggcaga agaaggtcac ctttgacaga ctgcaggtcc tggacgacca ctaccgggac 6180 

gtgctcaagg agatgaaggc gaaggcgtcc acagttaagg ctaaacttct atccgtggag 6240 

gaagcctgta agctgacgcc cccacattcg gccagatcta aatttggcta tggggcaaag 6300 

gacgtccgga acctatccag caaggccgtt aaccacatcc gctccgtgtg gaaggacttg 6360 

ctggaagaca ctgagacacc aattgacacc accatcatgg caaaaaatga ggttttctgc 6420 

gtccaaccag agaagggggg ccgcaagcca gctcgcctta tcgtattccc agatttgggg 6480 

gttcgtgtgt gcgagaaaat ggccctttac gatgtggtct ccaccctccc tcaggccgtg 6540 

atgggctctt catacggatt ccaatactct cctggacagc gggtcgagtt cctggtgaat 6600 

gcctggaaag cgaagaaatg ccctatgggc ttcgcatatg acacccgctg ttttgactca 6660 

acggtcactg agaatgacat ccgtgttgag gagtcaatct accaatgttg tgacttggcc 6720 

cccgaagcca gacaggccat aaggtcgctc acagagcggc tttacatcgg gggccccctg 6780 

actaattcta aagggcagaa ctgcggctat cgccggtgcc gcgcgagcgg tgtactgacg 6840 

accagctgcg gtaataccct cacatgttac ttgaaggccg ctgcggcctg tcgagctgcg 6900 

aagctccagg actgcacgat gctcgtatgc ggagacgacc ttgtcgttat ctgtgaaagc 6960 

gcggggaccc aagaggacga ggcgagccta cgggccttca cggaggctat gactagatac 7020 

tctgcccccc ctggggaccc gcccaaacca gaatacgact tggagttgat aacatcatgc 7080 

tcctccaatg tgtcagtcgc gcacgatgca tctggcaaaa gggtgtacta tctcacccgt 7140 

gaccccacca ccccccttgc gcgggctgcg tgggagacag ctagacacac tccagtcaat 7200 

toctggctag gcaacatcat catgtatgcg cccaccttgt gggcaaggat gatcctgatg 7260 

actcatttct tctccatcct tctagctcag gaacaacttg aaaaagccct agattgtcag 7320 

atctacgggg cctgttactc cattgagcca cttgacctac ctcagatcat tcaacgactc 7380 

catggcctta gcgcattttc actccatagt tactctccag gtgagatcaa tagggtggct 7440 

tcatgcctca ggaaacttgg ggtaccgccc ttgcgagtct ggagacatcg ggccagaagt 7500 
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gtccgcgcta ggctactgtc ccaggggggg 
aactgggcag taaggaccaa gctcaaactc 
ttatccagct ggttcgttgc tggttacagc 
gcccgacccc gctggttcat gtggtgccta 
ctactcccca accgatgaac ggggagctaa 
tttccctttt tttttttctt tttttttttt 
tttttcctct ttttttcctt ttctttcctt 
tagctgtgaa aggtccgtga gccgcttgac 
agatcaagt 



agggctgcca cttgtggcaa gtacctcttc 7560 
actccaatcc cggctgcgtc ccagttggat 7620 
gggggagaca tatatcacag cctgtctcgt 7680 
ctcctacttt ctgtaggggt aggcatctat 7740 
acactccagg ccaataggcc atcctgtttt 7800 
tttttttttt tttttttttt ttctcctttt 7860 
tggtggctcc atcttagccc tagtcacggc 7920 
tgcagagagt gctgatactg gcctctctgc 7980 
7989 
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<210> 5 
<211> 8649 
<212> DNA 

s <213> Hepatitis C Virus 

<400> 5 

gccagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactactg 60 

tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 

cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 180 

gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccccc 240 

10 gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 

gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 

ctcaaagaaa aaccaaacgt aacaccaacg ggcgcgccat gattgaacaa gatggattgc 420 

acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 480 

caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 540 

ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 600 

15 cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 660 

gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 720 

ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 780 

cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 840 

tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 900 

ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc 960 

atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttet ggattcatcg 1020 

20 actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 1080 

ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 1140 

ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagtttaaa 1200 

cagaccacaa cggtttccct ctagcgggat caattccgcc cctotccctc ccccccccct 1260 

aacgttactg gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt 1320 

tccaccatat tgccgtcttt tggcaatgtg agggcocgga aacctggccc tgtcttcttg 1380 

25 acgagcattc ctaggggtct ttccoctctc gccaaaggaa tgcaaggtct gttgaatgtc 1440 

gtgaaggaag cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt 1500 

tgcaggcagc ggaacccccc acctggcgac aygtgcctct gcggccaaaa gccacgtgta 1560 

taagatacac ctgcaaaggc ggcacaaccc cagtgcca«j ttgtgagttg gatagttgtg 1620 

gaaagagtca aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag 1680 

gtaccccatt gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag 1740 

tcgaggttaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 1800 

30 cacgataata ccatggaccg ggagatggca gcatcgtgcg gaggcgcggt tttcgtaggt 1860 

ctgatactct tgaccttgtc accgcactat aagctgttcc tcgctaggct catatggtgg 1920 

ttacaatatt ttatcaccag ggccgaggca cacttgcaag tgtggatccc ccecctcaac 1980 

gttcgggggg gccgcgatgc cgtcatcctc ctcacgtgcg cgatccaccc agagctaatc 2040 

tttaccatca ccaaaatctt gctcgccata ctcggtccac tcatggtgct ccaggctggt 2100 

ataaccaaag tgccgtactt cgtgcgcgca cacgggctca ttcgtgcatg catgctggtg 2160 

35 cggaaggttg ctgggggtca ttatgtccaa atggctctca tgaagttggc cgcactgaca 2220 

ggtacgtacg tttatgacca tctcacccca ctgcgggact gggcccacgc gggcctacga 2280 

gaccttgcgg tggcagttga gcccgtcgtc ttctctgata tggagaccaa ggttatcacc 2340 

tggggggcag acaccgcggc gtgtggggac atcatcttgg gcctgcccgt ctccgcccgc 2400 

agggggaggg agatacatct gggaccggca gacagccttg aagggcaggg gtggcgactc 2460 

ctcgcgccta ttacggccta ctcccaacag acgcgaggcc tacttggctg catcatcact 2520 

agcctcacag gccgggacag gaaccaggtc gagggggagg tccaagtggt ctccaccgca 2580 

40 acacaatott tcctggcgac ctgcgtcaat ggcgtgtgtt ggactgtcta tcatggtgcc 2640 

ggctcaaaga cccttgccgg cccaaagggc ccaatcaccc aaatgtacac caatgtggac 2700 

caggacctcg tcggctggca agcgcccccc ggggcgcgtt ccttgacacc atgcacctgc 2760 

ggcagctcgg acctttactt ggtcacgagg catgccgatg tcattccggt gcgccggcgg 2820 

ggcgacagca gggggagcct actctccccc aggcccgtct cctacttgaa gggctcttcg 2880 

ggcggtccac tgctctgccc ctcggggcac gctgtgggca tctttcgggc tgccgtgtgc 2940 

45 acccgagggg ttgcgaaggc ggtggacttt gtacccgtcg agtctatgga aaccactatg 3000 

cggtccccgg tcttcacgga caactcgtcc cctccggccg taccgcagac attccaggtg 3060 

gcccatctac acgcccctac tggtagcggc aagagcacta aggtgccggc tgcgtatgca 3120 

gcccaagggt ataaggtgct tgtcctgaac ccgtccgtcg ccgccaccct aggtttcggg 3180 

gcgtatatgt ctaaggcaca tggtatcgac cctaacatca gaaccggggt aaggaccatc 3240 

accacgggtg cccccatcac gtactccacc tatggcaagt ttcttgccga cggtggttgc 3300 

50 tctgggggcg cctatgacat cataatatgt gatgagtgcc actcaactga ctcgaccact 3360 

atcctgggca tcggcacagt cctggaccaa gcggagacgg ctggagcgcg actcgtcgtg 3420 

ctcgccaccg ctacgcctcc gggatcggtc accgtgccac atccaaacat cgaggaggtg 3480 

gctctgtcca gcactggaga aatcoccttt tatggcaaag ccatccccat cgagaccatc 3540 
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aaggggggga ggcacctcat tttctgccat tccaagaaga aatgtgatga gctcgccgcg 3600 
aagctgtccg gcctcggact caatgctgta gcatattacc ggggccttga tgtatccgtc 3660 
ataccaacta gcggagacgt cattgtcgta gcaacggacg ctctaatgac gggctttacc 3720 
ggcgatttcg actcagtgat cgactgcaat acatgtgtca cccagacagt cgacttcagc 3780 
ctggacccga ccttcaccat tgagacgacg accgtgccac aagacgcggt gtcacgctcg 3840 
cagcggcgag gcaggactgg taggggcagg atgggcattt acaggtttgt gactccagga 3900 
gaacggccct cgggcatgtt cgattcctcg gttctgtgcg agtgctatga cgcgggctgt 3960 
gcttggtacg agctcacgcc cgccgagacc tcagttaggt tgcgggctta cctaaacaca 4020 
ccagggttgc ccgtctgcca ggaccatctg gagttctggg agagcgtctt tacaggcctc 4080 
acccacatag acgcccattt cctgtcccag aotaagcagg caggagacaa cttcccctac 4140 
ctggtagcat accaggctac ggtgtgcgcc agggctcagg ctccacctcc atcgtgggac 4200 
caaatgtgga agtgtctcat acggctaaag cctacgctgc acgggccaac gcccctgctg 4260 
tataggctgg gagccgttca aaacgaggtt aotaccacac accccataac caaatacatc 4320 
atggcatgca tgtcggctga cctggaggtc gtcacgagca cctgggtgct ggtaggcgga 4380 
gtcctagcag ctctggccgc gtattgcctg acaacaggca gcgtggtcat tgtgggcagg 4440 
atcatcttgt ccggaaagcc ggccatcatt cecgacaggg aagtccttta ccgggagttc 4500 
gatgagatgg aagagtgcgc ctcacacctc ccttacatcg aacagggaat gcagctcgcc 4560 
gaacaattca aacagaaggc aatcgggttg ctgcaaacag ccaccaagca agcggaggct 4620 
gctgctcccg tggtggaatc caagtggcgg accctcgaag ccttctgggc gaagcatatg 4680 
tggaatttca tcagcgggat acaatattta gcaggcttgt ccactctgcc tggcaacocc 4740 
gcgatagcat cactgatggc attcaoagcc tctatoaeca gcccgctcac cacccaaoat 4800 
accctcctgt ttaacatcct ggggggatgg gtggocgccc aacttgotcc tcocagcgct 4860 
gcttctgctt tcgtaggcgc cggcatcgct ggagcggctg ttggeagcat aggccttggg 4920 
aaggtgcttg tggatatttt ggcaggttat ggagcagggg tggcaggcgc gctcgtggcc 4980 
tttaaggtca tgagcggcga gatgccctcc accgaggacc tggttaacct actccctgct 5040 
atcctctccc ctggcgccct agtcgtcggg gtcgtgtgcg cagcgatact gcgtcggcac 5100 
gtgggcccag gggagggggc tgtgcagtgg atgaaccggc tgatagcgtt cgcttcgcgg 5160 
ggtaaccacg tctccoccac gcactatgtg cctgagagcg acgctgcagc acgtgtcact 5220 
cagatcctct ctagtcttac catcactcag ctgctgaaga ggcttcacca gtggatcaac 5280 
gaggactgct ccacgccatg ctccggctcg tggctaagag atgtttggga ttggatatgc 5340 
acggtgttga ctgatttcaa gacctggctc cagtccaagc tcctgccgcg attgccggga 5400 
gtccccttct tctcatgtca acgtgggtac aagggagtct ggcggggcga cggcatcatg 5460 
caaaccacct gcccatgtgg agcacagatc accggacatg tgaaaaacgg ttccatgagg 5520 
atcgtggggc ctaggacctg tagtaacacg tggcatggaa cattccccat taacgcgtac 5560 
accacgggcc cctgcacgcc ctccccggcg ccaaattatt ctagggcgct gtggcgggtg 5640 
gctgctgagg agtacgtgga ggttacgcgg gtgggggatt tccactacgt gacgggcatg 5700 
accactgaca acgtaaagtg cccgtgtcag gttccggccc ccgaattctt cacagaagtg 5760 
gatggggtgc ggttgcacag gtacgctcca gcgtgcaaac ccctcctacg ggaggaggtc 5820 
acattcctgg tcgggctcaa tcaataccLg gttgggtcac agctcccatg cgagcccgaa 5880 
ccggacgtag cagtgctcac ttccatgctc accgacccct cccacattac ggcggagacg 5940 
gctaagcgta ggctggccag gggatctccc ccctccttgg ccagctcatc agctagccag 6000 
ctgtctgcgc cttccttgaa ggcaacatgc actacccgtc atgactcccc ggacgctgac 6060 
ctcatcgagg ccaacctcct gtggcggcag gagatgggcg ggaacatcac ccgcgtggag 6120 
tcagaaaata aggtagtaat tttggactct ttcgagccgc tccaagcgga ggaggatgag 6180 
agggaagtat ccgttccggc ggagatcctg cggaggtcca ggaaattccc tcgagcgatg 6240 
cccatatggg cacgcccgga ttacaaccct ccactgttag agtcctggaa ggacccggac 6300 
tacgtccctc cagtggtaca cgggtgtcca ttgccgcctg ccaaggcccc tccgatacca 6360 
cctccacgga ggaagaggac ggttgtcctg tcagaatcta ccgtgtcttc tgccttggcg 6420 
gagctcgcca caaagacctt cggcagctcc gaatcgtcgg ccgtcgacag cggcacggca 6480 
acggcctctc ctgaccagcc ctccgacgac ggcgacgcgg gatccgacgt tgagtcgtac 6540 
tcctccatgc ccccccttga gggggagccg ggggatcccg atctcagoga cgggtcttgg 6600 
tctaocgtaa gcgaggaggc tagtgaggac gtcgtctgct gctcgatgtc ctacacatgg 6660 
acaggcgccc tgatcacgcc atgcgctgcg gaggaaacca agctgcccat caatgcactg 6720 
agcaactctt tgctccgtca ccacaacttg gtctatgcta caacatctcg cagcgcaagc 6780 
ctgcggcaga agaaggtcac ctttgacaga ctgcaggtcc tggacgacca ctaccgggac 6840 
gtgctcaagg agatgaaggc gaaggcgtcc acagttaagg ctaaacttct atccgtggag 6900 
gaagcctgta agctgacgcc cccacattcg gccagatcta aatttggcta tggggcaaag 6960 
gacgtccgga acctatccag caaggccgtt aaccacatcc gctccgtgtg gaaggacttg 7020 
ctggaagaca ctgagacacc aattgacacc accatcatgg caaaaaatga ggttttctgc 7080 
gtccaaccag agaagggggg ccgcaagcca gctcgcctta tcgtattccc agatttgggg 7140 
gttcgtgtgt gcgagaaaat ggccctttac gatgtggtct ccaccctccc tcaggccgtg 7200 
atgggctctt catacggatt ccaatactct cctggacagc gggtcgagtt cctggtgaat 7260 
gcctggaaag cgaagaaatg ccctatgggc ttcgcatatg acacccgctg ttttgactca 7320 
acggtcactg agaatgacat ccgtgttgag gagtcaatct accaatgttg tgacttggcc 7380 
cccgaagcca gacaggccat aaggtcgctc acagagcggc tttacatcgg gggccccctg 7440 
sagggcagaa ctgcggctat cgccggtgcc gcgcgagcgg tgtactgacg 7500 
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accagctgcg gtaataccct cacatgttac 
aagctccagg actgcacgat gctcgtatgc 
gcggggaccc aagaggacga ggcgagccta 
tctgcccccc ctggggaccc gcccaaacca 
tcctccaatg tgtcagtcgc gcacgatgca 
gaccccacca ccccccttgc gcgggctgcg 
tcctggctag gcaacatcat catgtatgcg 
actcatttct tctccatcct tctagctcag 
atctacgggg cctgttactc cattgagcca 
catggcctta gcgcattttc actccatagt 
tcatgcctca ggaaacttgg ggtaccgccc 
gtccgcgcta ggctactgtc ccaggggggg 
aactgggcag taaggaccaa gctcaaactc 
ttatccagct ggttcgttgc tggttacagc 
gcccgacccc gctggttcat gtggtgccta 
ctactcccca accgatgaac ggggagctaa 
tttccctttt tttttttctt tttttttttt 
tttttcctct ttttttcctt ttctttcctt 
tagctgtgaa aggtccgtga gccgcttgac 
agatcaagt 



ttgaaggccg ctgcggcctg tcgagctgcg 7560 
ggagacgacc ttgtcgttat ctgtgaaagc 7620 
cgggccttca cggaggctat gactagatac 7680 
gaatacgact tggagttgat aacatcatgc 7740 
tctggcaaaa gggtgtacta tctcacccgt 7800 
tgggagacag ctagacacac tccagtcaat 7860 
cccaccttgt gggcaaggat gatcctgatg 7920 
gaacaacttg aaaaagccct agattgtcag 7980 
cttgacctac ctcagatcat tcaacgactc 8040 
tactctccag gtgagatcaa tagggtggct 8100 
ttgcgagtct ggagacatcg ggccagaagt 8160 
agggctgcca cttgtggcaa gtacctcttc 8220 
actccaatcc cggctgcgtc ccagttggat 8280 
gggggagaca tatatcacag cctgtctcgt 8340 
ctcctacttt ctgtaggggt aggcatctat 8400 
acactccagg ccaataggcc atcctgtttt 8460 
tttttttttt tttttttttt ttctcctttt 8520 
tggtggctcc atcttagccc tagtcacggc 8580 
tgcagagagt gctgatactg gcctctctgc 8640 
8649 
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<210> 6 
<211> 8001 
<212> DNA 

<213> Hepatitis C Virus 
<400> 6 

gccagccccc gattgggggc gaeactecac catagatcac tcccctgtga ggaactactg 60 
tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 
cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 160 
gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 
gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaacgt aacaccaacg ggcgcgccat gattgaacaa gatggattgc 420 
acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 480 
caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 540 
ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 600 
cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 660 
gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 720 
ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgaCc 780 
cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 840 
tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 900 
ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc 960 
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 1020 
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 1080 
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 1140 
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagtttaaa 1200 
cagaocacaa cggtttccot ctagogggat caattccgcc cctctccctc ccccccccct 1260 
aacgttactg gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt 1320 
tccaccatat tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg 1380 
acgagcattc ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc 1440 
gtgaaggaag cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt 1500 
tgcaggcagc ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta 1560 
taagatacac ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg 1620 
gaaagagtca aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag 1680 
gtaccccatt gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag 1740 
tcgaggttaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 1800 
cacgataata ccatggcgcc tattacggcc tactcccaac agacgcgagg cctacttggc 1860 
tgcatcatca ctagcctcac aggccgggac aggaaccagg tcgaggggga ggtccaagtg 1920 
gtctccaccg caacacaatc tttcctggcg acctgcgtca atggcgtgtg ttggactgtc 1980 
tatcatggtg ccggctcaaa gacccttgcc ggcccaaagg gcccaatcac ccaaatgtac 2040 
accaatgtgg accaggacct cgtcggctgg caagcgcccc ccggggcgcg ttccttgaca 2100 
ccatgcacct gcggcagctc ggacctttac ttggtcacga ggcatgccga tgtcattccg 2160 
gtgcgccggc ggggcgacag cagggggagc ctactctccc ccaggcccgt ctcctacttg 2220 
aagggctctt cgggcggtcc actgctctgc ccctcggggc atgctgtggg catctttcgg 2280 
gctgccgtgt gcacccgagg ggttgcgaag gcggtggact ttgtacccgt cgagtctatg 2340 
gaaaccacta tgcggtcccc ggtcttcacg gacaactcgt cccctccggc cgtaccgcag 2400 
acattccagg tggcccatct acacgcccct actggtagcg gcaagagcac taaggtgccg 2460 
gctgcgtatg cagcccaagg gtataaggtg cttgtcctga acccgtccgt cgccgccacc 2520 
ctaggtttcg gggcgtatat gtctaaggca catggtatcg accctaacat cagaaccggg 2580 
gtagggacca tcaccacggg tgcccccatc acgtactcca cctatggcaa gtttcttgcc 2640 
gacggtggtt gctctggggg ogcctatgac atcataatat gtgatgagtg ccactcaact 2700 
gactcgacca ctatcctggg catcggcaca gtcctggacc aagcggagac ggctggagcg 2760 
cgactcgtcg tgctcgccac cgctacgcct ccgggatcgg tcaccgtgcc acatccaaac 2820 
atcgaggagg tggctctgtc cagcactgga gaaatcccct tttatggcaa agccatcccc 2880 
atcgcgacca tcaagggggg gaggcacctc attttctgcc attccaagaa gaaatgtgat 2940 
gagctcgccg cgaagctatc cggcctcgga ctcaatgctg tagcatatta ccggggcctt 3000 
gatgtatccg tcataccaac tagcggagac gtcat' gtcg tagcaacgga cgctctaatg 3060 
acgggcttta ccggcgattt cgactcagtg atcgactgca atacatgtgt cacccagaca 3120 
gtcgacttca gcctggaccc gaccttcacc attgagacga cgaccgtgcc acaagacgcg 3180 
gtgtcacgct cgcagcggcg aggcaggact ggtaggggca ggatgggcat ttacaggttt 3240 
gtgactcoag gagaacggcc ctcgggcatg ttcgattcct cggttctgtg cgagtgctat 3300 
gacgcgggct gtgcttggta cgagctcacg cccgccgaga cctcagttag gttgcgggct 3360 
tacctaaaca cacoagggct gcccgtctgc caggaccatc tggagttctg ggagagcgtc 3420 
tttacaggcc tcacccacat agacgcccat ttcttgtccc agactaggca ggcaggagac 3480 
aacttcccct acctggtagc ataccaggct acggtgtgcg ccagggctca ggctccacct 3540 
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ccatcgtggg accaaatgtg ggagtgtctc atacggctaa agcctacgct gcacgggcca 3600 
acgcccctgc tgtataggct gggagccgtt caaaacgagg ttactaccac acaccccata 3660 
accaaataca tcatggcatg catgtcggct gacctggagg tcgtcacgag cacctgggtg 3720 
ctggtaggcg gagtcctagc agctctggcc gcgtattgcc tgacaacagg cagcgtggtc 3780 
attgtgggca ggatcatctt gtccggaaag ccggccatca ttcccgacag ggaagtcctt 3840 
taccgggagt tcgatgagat ggaagagtgc gcctcacacc tcccttacat cgaacaggga 3900 
atgcagctcg ccgaacaatt caaacagaag gcaatogggt tgctgcaaac agocaccaag 3960 
caagcggagg ctgctgctcc cgtggtggaa tccaagtggc ggaccctcga agccttctgg 4020 
gcgaagcata tgtggaattt catcagcggg atacaatatt tagcaggctt gtccactctg 4080 
cctggcaacc ccgcgatagc atcactgatg gcattcacag cctctatcac cagcccgctc 4140 
accacccaac ataccctcct gtttaacatc ctggggggat gggtggccgc ccaacttgct 4200 
cctcccagcg ctgcttctgc tttcgtaggc gccggcatcg ctggagcggc tgttggcagc 4260 
ataggccttg ggaaggtgct tgtggatatt ttggcaggtt atggagcagg ggtggcaggc 4320 
gcgctcgtgg cctttaaggt catgagcggc gagatgccct ccaccgagga cctggttaac 4380 
ctactccctg ctatcctctc ccctggcgcc ctagtcgtcg gggtcgtgtg cgcagcgata 4440 
ctgcgtcggc acgtgggccc aggggagggg gctgtgcagt ggatgaaccg gctgatagcg 4500 
ttcgcttcgc ggggtaacca cgtctccccc acgcactatg tgtctgagag cgacgctgca 4560 
gcacgtgtca ctcagatcct ctctagtctt accatcactc agctgctgaa gaggcttcac 4620 
cagtggatca acgaggactg ctccacgcca tgctccggct cgtggctaag agatgtttgg 4680 
gattggatat gcaoggtgtt gactgatttc aagacctggc tccagtccaa gctcctgccg 4740 
cgattgccgg gagtcocctt cttctcatgt oaacgtgggt acaagggagt ctggcggggc 4800 
gacggcatca tgcaaaccac ctgcccatgt ggagcacaga tcaccggaca tgtgaaaaac 4860 
ggttccatga ggatcgtggg gcctaggacc tgtagtaaca cgtggcatgg aacattcccc 4920 
attaacgcgt acaccacggg cccctgcacg ccctccccgg cgccaaatta ttctagggcg 4980 
ctgtggcggg tggctgctga ggagtacgtg gaggttacgc gggtggggga tttccactac 5040 
gtgacgggca tgaccactga caacgtaaag tgcccgtgtc aggttccggc ccccgaattc 5100 
ttcaoagaag tggatggggt gcggttgcac aggtacgctc cagcgtgcaa acccctccta 5160 
cgggaggagg tcacattcot ggtcgggctc aatcaatacc tggttgggtc acagctccca 5220 
tgcgggcccg aaccggacgt agcagtgctc acttccatgc tcaccgaccc ctcccacatt 5280 
acggcggaga cggctaagcg taggctggcc aggggatctc ccccctcctt ggccagctca 5340 
tcagctagcc agctgtctgc gccttccttg aaggcaacat gcactacccg tcatgactcc 5400 
ccggacgctg acctcatcga ggccaacctc ctgtggcggc aggagatggg cgggaacatc 5460 
acccgcgtgg agtcagaaaa taaggtagta attttggact ctttcgagcc gctccaagcg 5520 
gaggaggatg agagggaagt atccgttccg gcggagatcc tgcggaggtc caggaaattc 5580 
cctcgagcga tgcccatatg ggcacgcccg gattacaacc ctccactgtt agagtcctgg 5640 
aaggacccgg actacgtccc tccagtggta cacgggtgtc cattgccgcc tgccaaggcc 5700 
cctccgatao oaoctcoacg gagggagagg acggttgtcc tgtcagaatc taccgtgtct 5760 
tctgccttgg cggagctcgc cacaaagacc ttcggcagct ccgaatcgtc ggccgtcgac 5820 
agcggcacgg caacggcctc tcctgaccag ccctccgacg acggcgacgc gggatccgac 5880 
gttgagtcgt actcctccat gccccccctt gagggggagc cgggggatcc cgatctcagc 5940 
gacgggtctt ggtctaccgt aagcgaggag gctagtgagg acgtcgtctg ctgctcgatg 6000 
tcctacacat ggacaggcgc cctgatcacg ccatgcgctg cggaggaaac caagctgccc 6060 
gtcaatgcac tgagcaactc tttgctccgt oaccacaact tggtctatgc tacaacatct 6120 
cgcagcgcaa gcctgcggca gaagaaggtc acctttgaca gactgcaggt cctggacgac 6180 
cactaccggg acgtgctcaa ggagatgaag gcgaaggcgt ccacagttaa ggctaaactt 6240 
ctatccgtgg aggaagcctg taagctgacg cccccacatt cggccagatc taaatttggc 6300 
tatggggcaa aggacgtccg gaacctatcc agcaaggccg ttaaccacat ccgctccgtg 6360 
tggaaggact tgctggaaga cactgagaca ccaattgaca ccaccatcat ggcaaaaaat 6420 
gaggttttct gcgtccaacc agagaagggg ggccgcaagc cagctcgcct tatcgtattc 6480 
ccagatttgg gggttcgtgt gtgcgagaaa atggcccttt acgatgtggt ctccaccctc 6540 
cctcaggccg tgatgggctc ttcatacgga ttccaatact ctcctggaca gcgggtcgag 6600 
ttcctggtga atgcctggaa agcgaagaaa tgccctatgg gcttcgcata tgacacccgc 6660 
tgttttgact caacggtcac tgagaatgac atccgtgttg aggagtcaat ctaccaatgt 6720 
tgtgacttgg cccccgaagc cagacaggcc ataaggtcgc tcacagagcg gctttacatc 6780 
gggggccccc tgactaattc taaagggcag aactgcggct atcgccggtg ccgcgcgagc 6840 
ggtgtactga cgaccagctg cggtaatacc ctcacatgtt atttgaaggc cgctgcggcc 6900 
tgtcgagctg cgaagctcca ggactgcacg atgctcgtat gcggagacga ccttgtcgtt 6960 
atctgtgaaa gcgcggggac ccaagaggac gaggcgagcc tacgggcctt cacggaggct 7020 
atgactagat actctgcccc ccctggggac ccgcccaaac cagaatacga cttggagttg 7080 
ataacatcat gctcctccaa tgtgtcagtc gcgcacgatg catctggcaa aagggtgtac 7140 
tatctcaccc gtgaccccac cacccccctt gcgcgggctg cgtgggagac agctagacac 7200 
actccagtca attcctggct aggcaacatc atcatgtatg cgcccacctt gtgggcaagg 7260 
atgatcctga tgactcattt cttctccatc cttctagctc aggaacaact tgaaaaagcc 7320 
ctagattgtc agatctacgg ggcctgttac tccattgagc cacttgacct acctcagatc 7380 
attcaacgac tccatggcct tagcgcattt tcactccata gttactctcc aggtgagatc 7440 
aatagggtgg cttcatgccL caggaaactt ggggtaccgc ccttgcgagt ctggagacat 7500 
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cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 
aagctcaaac tcactccaat cccggctgcg 7620 
gctggttaca gcgggggaga catatatcac 7680 
atgtggtgcc tactcctact ttctgtaggg 7740 
acggggagct aaacactcca ggccaatagg 7800 
tttttttttt tttttttttt tttttttttt 7860 
ttttctttcc tttggtggct ccatcttagc 7920 
gagccgcttg actgcagaga gtgctgatac 7980 
8001 
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<210> 7 
<211> 11076 
<212> DNA 

<213> Hepatitis C Virus 
<400> 7 

gccagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactactg 60 
tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 
ccoccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 180 
gaogaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 
gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaacgt aacaccaacg ggcgcgccat gattgaacaa gatggattgc 420 
acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 480 
caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 540 
ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 600 
cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 660 
gaagggactg gctgctattg ggcgaagtgc oggggoagga tctcctgtca tctcaccttg 720 
ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 780 
cggctacctg cccattcgac caccaagcga aacatcgoat cgagcgagca cgtactcgga 840 
tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 900 
ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc 960 
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 1020 
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 1080 
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 1140 
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagtttaaa 1200 
cagaccacaa cggtttcoct ctagcgggat caattccgcc cctctccctc ccccccccct 1260 
aacgttactg gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt 1320 
tccaccatat tgccgtcttt tggcaatgtg agggcccgga aacctggcec tgtcttcttg 1380 
acgagcattc ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc 1440 
gtgaaggaag cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt 1500 
tgcaggcagc ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta 1560 
taagatacac ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg 1620 
gaaagagtca aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag 1680 
gtaccccatt gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag 1740 
tcgaggttaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 1800 
cacgataata ccatgggcac gaatcctaaa cctcaaagaa aaaccaaacg taacaccaac 1860 
ogccgcocac aggacgtcaa gttcccgggc ggtggtcaga tcgtcggtgg agtttacctg 1920 
ttgccgcgca ggggccccag gttgggtgtg cgcgcgacta ggaagacttc cgagcggtcg 1980 
caacctcgtg gaaggcgaca acctatcccc aaggctcgcc agcccgaggg tagggcctgg 2040 
gctcagcccg ggtacccctg gcccctctat ggcaatgagg gcttggggtg ggcaggatgg 2100 
ctcctgtcac cccgtggctc tcggcctagt Lggggcccca cggacccccg gcgtaggtcg 2160 
cgcaatttgg gtaaggtcat cgataccctc acgtgcggct tcgccgatct catggggtac 2220 
attccgctcg tcggcgcccc cctagggggc gctgccaggg ccctggcgca tggcgtccgg 2280 
gttctggagg acggcgtgaa ctatgcaaca gggaatctgc ccggttgctc cttttctatc 2340 
ttccttttgg ctttgctgtc ctgtttgacc atcccagctt ccgcttatga agtgcgcaac 2400 
gtatccggag tgtaccatgt cacgaacgac tgctccaacg caagcattgt gtatgaggca 2460 
gcggacatga tcatgcatac ccccgggtgc gtgccctgcg ttcgggagaa caactcctcc 2520 
cgctgctggg tagcgctcac tcccacgctc gcggccagga acgctagcgt ccccactacg 2580 
acgatacgac gccatgtcga tttgctcgtt ggggcggctg ctctctgctc cgctatgtac 2640 
gtgggagatc tctgcggatc tgttttcctc gtcgoccagc tgttcacctt ctcgcctcgc 2700 
cggcacgaga cagtacagga ctgcaattgc tcaatatatc ccggccacgt gacaggtcac 2760 
cgtatggctt gggatatgat gatgaactgg tcacctacag cagccctagt ggtatcgcag 2820 
ttactccgga tcccacaagc tgtcgtggat atggtggcgg gggcccattg gggagtccta 2880 
gcgggccttg cctactattc catggtgggg aactgggcta aggttctgat tgtgatgcta 2940 
ctctttgccg gcgttgacgg gggaacctat gtgacagggg ggacgatggc caaaaacacc 3000 
ctcgggatta cgtccctctt ttcacccggg tcatcccaga aaatccagct tgtaaacacc 3060 
aacggcagct ggcacatcaa caggactgcc ctgaactgca atgactccct caacactggg 3120 
ttccttgctg cgctgttcta cgtgcacaag ttcaactcat ctggatgccc agagcgcatg 3180 
gccagctgca gccccatcga cgcgttcgct caggggtggg ggcccatcac ttacaatgag 3240 
tcacacagct cggaccagag gccttattgt tggcactacg caccccggcc gtgcggtatc 3300 
gtacccgcgg cgcaggtgtg tggtccagtg tactgcttca ccccaagccc tgtcgtggtg 3360 
gggacgaccg accggttcgg cgtccctacg tacagttggg gggagaatga gacggacgtg 3420 
ctgcttctta acaacacgcg gccgccgcaa ggcaactggt ttggctgtac atggatgaat 3480 
agcactgggt toaccaagac gtgcgggggc cccccgtgta acatcggggg gatcggcaat 3540 
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aaaaccttga cctgccccac ggactgcttc cggaagcacc ccgaggccac ttacaccaag 3600 
tgtggttcgg ggccttggtt gacacccaga tgcttggtcc actacccata caggctttgg 3660 
cactacccct gcactgtcaa ctttaccatc ttcaaggtta ggatgtacgt ggggggagtg 3720 
gagcacaggc tcgaagccgc atgcaattgg actcgaggag agcgttgtaa cctggaggac 3780 
agggacagat cagagcttag cccgctgctg ctgtctacaa cggagtggca ggtattgccc 3840 
tgttccttca ccaccctacc ggctctgtcc actggtttga tccatctcca tcagaacgtc 3900 
gtggacgtac aatacotgta cggtataggg tcggcggttg tctcctttgc aatcaaatgg 3960 
gagtatgtcc tgttgctctt ccttoctctg gcggacgegc gcgtctgtgc ctgcttgtgg 4020 
atgatgctgc tgatagctca agctgaggcc gocctagaga acctggtggt cctcaacgcg 4080 
gcatccgtgg ccggggcgca tggcattctc tccttcctcg tgttcttctg tgctgcctgg 4140 

10 tacatcaagg gcaggctggt ccctggggcg gcatatgccc tctacggcgt atggccgcta 4200 

ctcctgctcc tgctggcgtt accaccacga gcatacgcca tggaccggga gatggcagca 4260 
tcgtgcggag gcgcggtttt cgtaggtctg atactcttga ccttgtcacc gcactataag 4320 
ctgttcctcg ctaggctcat atggtggtta caatatttta tcaccagggc cgaggcacac 4380 
ttgoaagtgt ggatcccccc cctcaacgtt cgggggggcc gogatgccgt catcctcctc 4440 
acgtgcgcga tccacccaga gotaatcttt accatcacca aaatcttgct cgccataotc 4500 
ggtccactca tggtgctcca ggctggtata accaaagtgc cgtacttcgt gcgcgcacac 4560 
gggctcattc gtgcatgcat gctggtgcgg aaggttgctg ggggtcatta tgtccaaatg 4620 
gctctcatga agttggccgc actgacaggt acgtacgttt atgaccatct caccccactg 4680 
cgggactggg cccacgcggg cctacgagac cttgcggtgg cagttgagcc cgtcgtcttc 4740 
tctgatatgg agaccaaggt tatcacctgg ggggcagaca ccgcggcgtg tggggacatc 4800 
atcttgggcc tgcccgtctc cgcccgcagg gggagggaga tacatctggg accggcagac 4B60 
agccttgaag ggcaggggtg gcgactcctc gcgcctatta cggcctactc ccaacagacg 4920 

20 cgaggcctac ttggctgcat catcactagc ctcacaggcc gggacaggaa ccaggtcgag 4 980 

ggggaggtcc aagtggtctc caccgcaaca caatctttcc tggcgacctg cgtcaatggc 5040 
gtgtgttgga ctgtctatca tggtgccggc tcaaagaccc ttgccggccc aaagggccca 5100 
atcacccaaa tgtacaccaa tgtggaccag gacctcgtcg gctggcaagc gccccccggg 5160 
gcgcgttcct tgacaccatg cacctgcggc agctcggacc tttacttggt cacgaggcat 5220 
gccgatgtca ttccggtgcg ccggcggggc gaoagcaggg ggagcctact ctcccccagg 5280 
cccgtctcot acttgaaggg ctcttcgggc ggtccactgc tctgcccctc ggggcatgct 5340 

25 gtgggcatct ttcgggctgc cgtgtgcacc cgaggggttg cgaaggcggt ggactttgta 5400 

cccgtcgagt ctatggaaac cactatgcgg tccccggtct tcacggacaa ctcgtcccct 5460 
ccggccgtac cgcagacatt ccaggtggcc catctacacg cccctactgg tagcggcaag 5520 
agcactaagg tgccggctgc gtatgcagcc caagggtata aggtgcttgt cctgaacccg 5580 
tccgtcgccg ccaccctagg tttcggggcg tatatgtcta aggcacatgg tatcgaccct 5640 
aacatcagaa ccggggtagg gaccatcacc acgggtgccc ccatcacgta ctccacctat 5700 

30 ggcaagtttc ttgccgacgg tggttgctct gggggcgcct atgacatcat aatatgtgat 5760 

gagtgccact caactgactc gaccactatc ctgggcatcg gcacaqtcct ggaccaagcg 5820 
gagacggctg gagcgcgact cgtcgtgctc gccaccgcta cgcctccggg atcggtcacc 5880 
gtgccacatc caaacatcga ggaggtggct ctgtccagca ctggagaaat ccccttttat 5940 
ggcaaagcca tccccatcgc gaocatcaag ggggggaggc. acctcatttt ctgccattcc 6000 
aagaagaaat gtgatgagct cgccgcgaag ctatccggcc tcggactcaa tgctgtagca 6060 
tattaccggg gccttgatgt atccgtcata ccaactagcg gagacgtcat tgtcgtagca 6120 

35 acggacgctc taatgacggg ctttaccggc gatttcgact cagtgatcga ctgcaataca 6180 

tgtgtcaccc agacagtcga cttcagcctg gacccgacct tcaccattga gacgacgacc 6240 
gtgccacaag acgcggtgtc acgctcgcag cggcgaggca ggactggtag gggcaggatg 6300 
ggcatttaca ggtttgtgac tccaggagaa cggccctcgg gcatgttcga ttcctcggtt 6360 
ctgtgcgagt gctatgacgc gggctgtgct tggtacgagc tcacgcccgc cgagacctca 6420 
gttaggttgc gggcttacct aaacacacca gggctgcccg tctgccagga ccatctggag 6480 

40 ttctgggaga gcgtctttac aggcctcacc cacatagacg cccatttctt gtcccagact 6540 

aggcaggcag gagacaactt cccctacctg gtagcatacc aggctacggt gtgcgccagg 6600 
gctcaggctc cacctccatc gtgggaccaa atgtgggagt gtctcatacg gctaaagcct 6660 
acgctgcacg ggccaacgcc cctgctgtat aggctgggag ccgttcaaaa cgaggttact 6720 
accacacacc ccataaccaa atacatcatg gcatgcatgt cggctgacct ggaggtcgtc 6780 
acgagcacct gggtgctggt aggcggagtc ctagcagctc tggccgcgta ttgcctgaca 6840 
acaggcagcg tggtcattgt gggcaggatc atcttgtccg gaaagccggc catcattocc 6900 

45 gacagggaag tcctttaccg ggagttcgat gagatggaag agtgcgcctc acacctccct 6960 

tacatcgaac agggaatgca gctcgccga;- caattcaaac agaaggcaat cgggttgctg 7020 
caaacagcca ccaagcaagc ggaggctgct gctcccgtgg tggaatccaa gtggcggacc 7080 
ctcgaagcct tctgggcgaa gcatatgtgg aatttcatca gcgggataca atatttagca 7140 
ggcttgtcca ctctgcctgg caaccccgcg atagcatcac tgatggcatt cacagcctct 7200 
atcaccagcc cgctcaccac ccaacatacc ctcctgttta acatcctggg gggatgggtg 7260 

50 gccgcccaac ttgctcctcc cagcgctgct tctgctttog taggcgccgg catcgctgga 7320 

gcggotgttg gcagcatagg ccttgggaag gtgcttgtgg atattttggc aggttatgga 7380 
gcaggggtgg caggcgcgct cgtggccttt aaggtcatga gcggcgagat gccctccacc 7440 
gaggacctgg ttaacctact ccctgctatc ctctcccctg gcgccctagt cgtcggggtc 7500 
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gtgtgcgcag cgatactgcg tcggcacgtg 
aaccggctga tagcgttcgc ttcgcggggt 
gagagcgacg ctgcagcacg tgtcactcag 
ctgaagaggc ttcaccagtg gatcaacgag 
ctaagagatg tttgggattg gatatgcacg 
tccaagctcc tgccgcgatt gccgggagtc 
ggagtctggc ggggcgacgg catcatgcaa 
ggacatgtga aaaacggttc catgaggatc 
catggaacat tccccattaa cgcgtacacc 
aattattcta gggcgctgtg gcgggtggct 
ggggatttcc actacgtgac gggcatgacc 
ccggcccccg aattcttcac agaagtggat 
tgcaaacccc tcctacggga ggaggtcaca 
gggtcacagc tcccatgcgg gcccgaaccg 
gacccctccc acattacggc ggagacggct 
tccttggcca gctcatcagc tagccagctg 
acccgtcatg actccccgga cgctgacctc 
atgggcggga acatcacccg cgtggagtca 
gagccgctcc aagcggagga ggatgagagg 
aggtccagga aattccctcg agcgatgccc 
ctgttagagt cctggaagga cccggactac 
ccgcctgcca aggcccctcc gataccacct 
gaatctaccg tgtcttctgc cttggcggag 
tcgtcggccg tcgacagcgg cacggcaacg 
gacgcgggat ccgacgttga gtcgtactcc 
gatcccgatc tcagcgacgg gtcttggtct 
gtctgctgct cgatgtccta cacatggaca 
gaaaccaagc tgcccgtcaa tgcactgagc 
tatgctacaa catctcgcag cgcaagcctg 
caggtcctgg acgaccacta ccgggacgtg 
gttaaggcta aacttctatc cgtggaggaa 
agatctaaat ttggctatgg ggcaaaggac 

cacatccgct ccgtgtggaa ggacttgctg 
atcatggcaa aaaatgaggt tttctgegtc 
cgccttatcg tattcccaga tttgggggtt 
gtggtctcca ccctccctca ggccgtgatg 
ggacagcggg tcgagttcct ggtgaatgcc 
gcatatgaca cccgctgttt tgactcaacg 
tcaatctacc aatgttgtga cttggccccc 
gagcggcttt acatcggggg ccccctgact 
cggtgccgcg cgagcggtgt actgacgacc 
aaggccgctg cggcctgtcg agctgcgaag 
gacgaccttg tcgttatctg tgaaagcgcg 
gccttcacgg aggctatgac tagatactct 
tacgacttgg agttgataac atcatgctcc 
ggcaaaaggg tgtactatct cacccgtgac 
gagacagcta gacacactcc agtcaattcc 
accttgtggg caaggatgat cctgatgact 
caacttgaaa aagccctaga ttgtcagatc 
gacctacctc agatcattca acgactccat 
tctccaggtg agatcaatag ggtggcttca 
cgagtctgga gacatcgggc cagaagtgtc 
gctgccactt gtggcaagta cctcttcaac 
ccaatcccgg ctgcgtccca gttggattta 
ggagacatat atcacagcct gtctcgtgcc 
ctactttctg taggggtagg catctatcta 
ctccaggcca ataggccatc ctgttttttt 
tttttttttt tttttttttc tccttttttt 
tggctccatc ttagccctag tcacggctag 
agagagtgct gatactggcc tctctgcaga 



ggcccagggg agggggctgt gcagtggatg 7560 
aaccacgtct cccccacgca ctatgtgtct 7620 
atcctctcta gtcttaccat cactcagctg 7680 
gactgctcca cgccatgctc cggctcgtgg 7740 
gtgttgactg atttcaagac ctggctccag 7800 
cccttcttct catgtcaacg tgggtacaag 7860 
accacctgcc catgtggagc acagatcacc 7920 
gtggggccta ggacctgtag taacacgtgg 7980 
acgggcccct gcacgccctc cccggcgcca 8040 
gctgaggagt acgtggaggt tacgcgggtg 8100 
actgacaacg taaagtgccc gtgtcaggtt 8160 
ggggtgcggt tgcacaggta cgctccagcg 8220 
ttcctggtcg ggctcaatca atacctggtt 8280 
gacgtagcag tgctcacttc catgctcacc 8340 
aagcgtaggc tggccagggg atctcccccc 8400 
tctgcgcctt ccttgaaggc aacatgcact 8460 
atcgaggcca acctcctgtg gcggcaggag 8520 
gaaaataagg tagtaatttt ggactctttc 8580 
gaagtatccg ttccggcgga gatcctgcgg 8640 
atatgggcac gcccggatta caaccctcca 8700 
gtccctccag tggtacacgg gtgtccattg 8760 
ccacggaggg agaggacggt tgtcctgtca 8820 
ctcgccacaa agaccttcgg cagctccgaa 8880 
gcctctcctg accagccctc cgacgacggc 8940 
tccatgcccc cccttgaggg ggagccgggg 9000 
accgtaagcg aggaggctag tgaggacgtc 9060 
ggcgccctga tcacgccatg cgctgcggag 9120 
aactctttgc tccgtcacca caacttggtc 9180 
cggcagaaga aggtcacctt tgacagactg 9240 
ctcaaggaga tgaaggcgaa ggcgtccaca 9300 
gcctgtaagc tgacgccccc acattcggcc 9360 
gtccggaacc tatccagcaa ggccgttaac 9420 
gaagacactg agacaccaat tgacaccacc 9480 
caaccagaga aggggggccg caagccagct 9540 
cgtgtgtgcg agaaaatggc cctttacgat 9600 
ggctcttcat acggattcca atactctcct 9660 
tggaaagcga agaaatgccc tatgggcttc 9720 
gtcactgaga atgacatccg tgttgaggag 9780 
gaagccagac aggccataag gtcgctcaca 9840 
aattctaaag ggcagaactg cggctatcgc 9900 
agctgcggta ataccctcac atgttatttg 9960 
ctccaggact gcacgatgct cgtatgcgga 10020 
gggacccaag aggacgaggc gagcctacgg 10080 
gccccccctg gggacccgcc caaaccagaa 10140 
tccaatgtgt cagtcgcgca cgatgcatct 10200 
cccaccaccc cccttgcgcg ggctgcgtgg 10260 
tggctaggca acatcatcat gtatgcgccc 10320 
catttcttct ccatccttct agctcaggaa 10380 
tacggggcct gttactccat tgagccactt 10440 
ggccttagcg cattttcact ccatagttac 10500 
tgcctcagga aacttggggt accgcccttg 10560 
cgcgctaggc tactgtccca gggggggagg 10620 
tgggcagtaa ggaccaagct caaactcact 10680 
tccagctggt tcgttgctgg ttacagcggg 10740 
cgaccccgct ggttcatgtg gtgcctactc 10800 
ctccccaacc gatgaacggg gagctaaaca 10860 
cccttttttt ttttcttttt tttttttttt 10920 
ttcctctttt tttccttttc tttcctttgg 10980 
ctgtgaaagg tccgtgagcc gcttgactgc 11040 
tcaagt 11076 
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<210> 8 
<211> 8001 
<212> DNA 

<213> Hepatitis C Virus 
<400> 8 

gccagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactactg 60 
tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 
cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 180 
gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccocc 240 
gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 
gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaacgt aacaccaacg ggcgcgccat gattgaacaa gatggattgc 420 
acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 480 
caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 540 
ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 600 
cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 660 
gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 720 
ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 780 
cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 840 
tggaagcogg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 900 
ccgaactgtt cgccaggctc aaggcgcgca tgcccgaogg cgaggatctc gtcgtgaccc 960 
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 1020 
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 1080 
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 1140 
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagtttaaa 1200 
cagaccacaa cggtttccct ctagcgggat caattccgcc cctctccctc ccccccccct 1260 
aacgttactg gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt 1320 
tccacoatat tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg 1380 
acgagoattc ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc 1440 
gtgaaggaag cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt 1500 
tgcaggcagc ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta 1560 
taagatacac ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg 1620 
gaaagagtca aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag 1680 
gt-accccatt gtatgggatc Lgatct-gggg cctcggtgca catgctttac atgtgtttag 1740 
tcgaggttaa aaaacgtcta ggccccccga accacgggga cgtggttttc r.tttgaaaaa 1800 
cacgataata ccatggcgcc tattacggcc tactcccaac agacgcgagg cctacttggc 3 860 
tgcatcatca ctagcctcac aggccgggac aggaaccagg tcgaggggga ggtccaagtg 1920 
gtctccaccg caacacaatc tttcctggcg acctgcgtca atggcgtgtg ttggactgtc 1980 
tatcatggtg ccggctcaaa gacccttgcc ggcccaaagg gcccaatcac ccaaatgtac 2040 
accaatgtgg accaggacct cgtcggctgg caagcgcccc ccggggcgcg ttccttgaca 2100 
ccatgcacct gcggcagctc ggacctttac ttggtcacga ggcatgccga tgtcattccg 2160 
gtgcgccggc ggggcgacag cagggggagc ctactctccc ccaggcccgt ctcctacttg 2220 
aagggctctt cgggcggtcc actgctctgc ccctcggggc acgctgtggg catctttcgg 2280 
gctgccgtgt gcacccgagg ggttgcgaag gcggtggact ttgtacccgt cgagtctatg 2340 
gaaaccacta tgcggtcccc ggtcttcacg gacaactcgt cccctccggc cgtaccgcag 2400 
acattccagg tggcccatct acacgcccct actggtagcg gcaagagcac taaggtgccg 2460 
gctgcgtatg cagcccaagg gtataaggtg cttgtcctga acccgtccgt cgccgccacc 2520 
ctaggtttcg gggcgtatat gtctaaggca catggtatcg accctaacat cagaatcggg 2580 
gtaaggacca tcaccacggg tgcccccatc acgtactcca cctatggcaa gtttcttgcc 2640 
gacggtggtt gctctggggg cgcctatgac atcataatat gtgatgagtg ccactcaact 2700 
gactcgacca ctatcctggg catcggcaca gtcctggacc aagcggagac ggctggagcg 2760 
cgactcgtcg tgctcgccac cgctacgcct ccgggatcgg tcaccgtgcc acatccaaac 2820 
atcgaggagg tggctctgtc cagcactgga gaaatcccct tttatggcaa agccatcccc 2880 
atcgagacca tcaagggggg gaggcacctc attttctgcc attccaagaa gaaatgtgat 2940 
gagctcgccg cgaagctgtc cggcctcgga ctcaatgctg tagcatatta ccggggcctt 3000 
gatgtatccg tcataccaac tagcggagac gtcattgtcg tagcaacgga cgctctaatg 3060 
acgggcttta ccggtgactt cgactcagtg atcgactgca atacatgtgt cacccagaca 3120 
gtcgacttca gcctggaccc gaccttcacc attgagacga cgaccgtgcc acaagacgcg 3180 
gtgtcacgct cgcagcggcg aggcaggact ggtaggggca ggatgggcat ttacaggttt 3240 
gtgactccag gagaacggcc ctcgggcatg ttcgattcct cggttctgtg cgagtgctat 3300 
gacgcgggct gtgcttggta cgagctcacg cccgccgaga cctcagttag gttgcgggct 3360 
tacctaaaca caccagggtt gcccgtctgc caggaccatc tggagttctg ggagagcgtc 3420 
tttacaggcc tcacccacat agacgcccat ttcttgtccc agactaagca ggcaggagac 3480 
; acctggtagc ataccaggct acggtgtgcg ccagggctca ggctccacct 3540 
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ccatcgtggg accaaatgtg gaagtgtctc atacggctaa agcctacgct gcacgggcca 3600 

acgcccctgc tgtataggct gggagccgtt caaaacgagg ttactaccac acaccccata 3660 

accaaataca tcatggcatg catgtcggct gacctggagg tcgtcaogag cacctgggtg 3720 

ctggtaggcg gagtcctagc agctctggco gcgtattgoc tgacaacagg cagcgtggtc 3780 

attgtgggca ggatcatctt gtccggaaag ccggccatca ttcccgacag ggaagtcctt 3840 

taccgggagt tcgatgagat ggaagagtgc gcctcacacc tcccttacat cgaacaggga 3900 

atgcagctcg ccgaacaatt caaacagaag gcaatcgggt tgctgcaaac agccaccaag 3960 

caagcggagg ctgctgctcc cgtggtggaa tccaagtggc ggaccatcga agccttctgg 4020 

gcgaagcata tgtggaattt catcagcggg atacaatatt tagcaggctt gtccactctg 4080 

cctggcaacc ccgcgatagc atcactgatg gcattcacag cctctatcac cagcccgctc 4140 

accacccaac ataccctcct gtttaacatc ctggggggat gggtggccgc ccaacttgct 4200 

cctcccagcg ctgcttctgc tttcgtaggc gccggcatcg ctggagcggc tgttggcagc 4260 

ataggccttg ggaaggtgct tgtggatatt ttggcaggtt atggagcagg ggtggcaggc 4320 

gcgctcgtgg cctttaaggt catgagcggc gagatgccct ccaccgagga cctggttaac 4380 

ctactccctg ctatcctctc ccctggcgcc ctagtcgtcg gggtcgtgtg cgcagcgata 4440 

ctgcgtcggc acgtgggccc aggggagggg gctgtgcagt ggatgaaccg gctgatagcg 4500 

ttcgcttcgc ggggtaacca cgtctccccc acgcactatg tgcctgagag cgacgctgca 4560 

gcacgtgtca ctcagatcct ctctagtctt accatcactc agctgctgaa gaggcttcac 4620 

cagtggatca acgaggactg ctccacgcca tgctccggct cgtggctaag agatgtttgg 4680 

gattggatat gcacggtgtt gactgatttc aagacctggc tccagtocaa gctcctgccg 4740 

cgattgccgg gagtcccctt cttctcatgt caacgtgggt acaagggagt ctggcggggc 4800 

gacggcatca tgcaaaccac ctgcccatgt ggggcacaga tcaccggaca tgtgaaaaac 4860 

ggttccatga ggatcgtggg gcctaggacc tgtagtaaca cgtggcatgg aacattcccc 4920 

attaacgcgt acaccacggg cccctgcacg ccctccccgg cgccaaatta ttctagggcg 4980 

ctgtggcggg tggctgctga ggagtacgtg gaggttacgc gggtggggga tttccactac 5040 

gtgacgggca tgaccactga cgacgtaaag tgcccgtgtc aggttccggc ccccgaattc 5100 

ttcacagaag tggatggggt gcggttgcac aggtacgctc cagcgtgcaa acccctccta 5160 

cgggaggagg tcacattcct ggtcgggctc aatcaatacc tggttgggtc acagctccca 5220 

tgcgagcccg aaccggatgt agcagtgctc acttccatgc tcaccgaccc ctcccacatt 5280 

acggcggaga cggctaagcg taggctggcc aggggatctc ctcccccctt ggccagctca 5340 

tcagctagcc agctgtctgc gccttccttg aaggcaacat gcactacccg tcatgactcc 5400 

ccggacgctg acctcatcga ggccaacctc ctgtggcggc aggagatggg cgggaacatc 5460 

acccgcgtgg agtcagaaaa taaggtagta attttggact ctttcgagcc gctccaagcg 5520 

gaggaggatg agagggaagt atccgttccg gcggagatcc tgcggaggtc caggaaattc 5580 

cctcgagcga tgcccatatg ggcacgcccg gattacaacc ctccactgtt agagtcctgg 5640 

aaggacccgg actacgtccc tccagtggta cacgggtgtc cattgccgcc tgccaaggcc 5700 

cctccgatac caccLLcacg gaggaagagg acggttgtcc tgtcagaatc taccgtgtct 5760 

tctgccttgg cggagctcgc cacagagacc ttcggcagct ccgaatcgtc ggccgtcgac 5820 

agcggcacgg caacggcctc tcctgaccag ccctccgacg acggcgacgc gggatccgac 5880 

gttgagtcgt actcctccat gccccccctt gagggggagc cgggggatcc cgatctcagc 5940 

gacgggtctt ggtctaccgt aagcgaggag gctagtgagg acgtcgtctg ctgctcgatg 6000 

tcctacacat ggacaggcgc cctgatcacg ccatgcgctg cggaggaaac caagctgccc 6060 

atcaatgcac tgagcaacto tttgctccgt caccacaact tggtctatgc tacaacatct 6120 

cgcagcgcaa gcctgcggca gaagaaggtc acctttgaca gactgcaggt cctggacgac 6180 

cactaccggg acgtgctcaa ggagatgaag gcgaaggcgt ccacagttaa ggctaaactt 6240 

ctatccgtgg aggaagcctg taagctgacg cccccacatt cggccagatc taaatttggc 6300 

tatggggcaa aggacgtccg gaacctatcc agcaaggccg ttaaccacat ccgctccgtg 6360 

tggaaggact tgctggaaga cactgagaca ccaattgaca ccaccatcat ggcaaaaaat 6420 

gaggttttct gcgtccaacc agagaagggg ggccgcaagc cagctcgcct tatcgtattc 6480 

ccagatttgg gggttcgtgt gtgcgagaaa atggcccttt acgatgtggt ctccaccctc 6540 

cctcaggccg tgatgggctc ttcatacgga ttccaatact ctcctggaca gcgggtcgag 6600 

ttcctggtga atgcctggaa agcgaagaaa tgccctatgg gcttcgcata tgacacccgc 6660 

tgttttgact caacggtcac tgagaatgac atccgtgttg aggagtcaat ctaccaatgt 6720 

tgtgacttgg cccccgaagc cagacaggcc ataaggtcgc tcacagagcg gctttacatc 6780 

gggggccccc tgactaattc taaagggcag aactgcggct atcgccggtg ccgcgcgagc 6840 

ggtgtactga cgaccagctg cggtaatacc ctcacatgtt acttgaaggc cgctgcggcc 6900 

tgtcgagctg cgaagctcca ggactgcacg atgctcgtat gcggagacga ccttgtcgtt 6960 

atctgtgaaa gcgcggggac ccaagaggac gaggcgagcc tacgggcctt cacggaggct 7020 

atgactagat actctgcccc ccctggggac ccgcccaaac cagaataoga cttggagttg 7080 

ataacatcat gctcctccaa tgtqtcagtc gcgcacgatg catctggcaa aagggtgtac 7140 

tatctcaccc gtgaccccac cacccccctt gcgcgggctg cgtgggagac agctagacac 7200 

actccagtca attcctggct aggcaacatc atcatgtatg cgcccacctt gtgggcaagg 7260 

atgatcctga tgactcattt cttctccatc cttctagctc aggaacaact tgaaaaagcc 7320 

ctagattgtc agatctacgg ggcctgttac tccattgagc cacttgacct acctcagatc 7380 

attcaacgac tccatggcct tagcgcattt tcactccata gttactctcc aggtgagatc 7440 

aatagggtgg cttcatgcct caggaaactt ggggtaccgc ccttgcgagt ctggagacat 7500 
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cgggccagaa gtgtccgcgc taggctactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 
aagctcaaac tcactccaat cccggctgcg 7620 
gctggttaca gcgggggaga catatatcac 7680 
atgtggtgcc tactcctact ttctgtaggg 7740 
acggggagct aaacactcca ggccaatagg 7800 
tttttttttt tttttttttt tttttttttt 7860 
ttttctttcc tttggtggct ccatcttagc 7920 
gagccgcttg actgcagaga gtgctgatac 7980 
8001 
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<210> 9 
<211> 11076 
<212> DNA 

<213> Hepatitis C Virus 
<400> 9 

gccagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactactg 60 
tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 
cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 180 
gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 
gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaacgt aacaccaacg ggcgcgccat gattgaacaa gatggattgc 420 
acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 480 
caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 540 
ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 600 
cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 660 
gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 720 
ctcctgcoga gaaagtatco atcatggctg atgoaatgcg goggctgcat acgcttgatc 780 
cggctacctg cccattcgao caccaagcga aacatcgcat ogagcgagca cgtactcgga 840 
tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 900 
ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc 960 
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 1020 
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 1080 
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 1140 
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagtttaaa 1200 
cagaocacaa cggtttccct ctagcgggat caattccgcc cctctccotc ccccccccct 1260 
aacgttactg gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt 1320 
tccaocatat tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg 1380 
acgagcattc ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc 1440 
gtgaaggaag cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt 1500 
tgcaggcagc ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta 1560 
taagatacac ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg 1620 
gaaagagtca aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag 1680 
gtaccccatt gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag 1740 
tcgaggttaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 1800 
cacgataata ccatgggcac gaatcctaaa cctcaaagaa aaaccaaacg taacaccaac 1860 
cgccgcccao aggacgtcaa gttcccgggc ggtggtcaga tcgtcggtgg agtttacotg 1920 
ttgccgcgca ggggccccag gttgggtgtg cgcgcgacta ggaagacttc cgagcggtcg 19B0 
caacctcgtg gaaggcgaca acctatcccc aaggctcgcc agcccgaggg tagggcctgg 2040 
gctcagcccg ggtacccctg gcccctctat ggcaatgagg gcttggggtg ggcaggatgg 2100 
ctcctgtcac cccgtggctc tcggcctagt tggggcccca cggacccccg gcgtaggtcg 2160 
cgcaatttgg gtaaggtcat cgataccctc acgtgcggct tcgccgatct catggggtac 2220 
attccgctcg tcggcgcccc cctagggggc gctgccaggg ccctggcgca tggcgtccgg 2280 
gttctggagg acggcgtgaa ctatgcaaca gggaatctgc ccggttgctc cttttctatc 2340 
ttccttttgg ctttgctgtc ctgtttgacc atcccagctt ccgcttatga agtgcgcaac 2400 
gtatccggag tgtaccatgt cacgaacgac tgctccaacg caagcattgt gtatgaggca 2460 
gcggacatga tcatgcatac ccccgggtgc gtgccctgcg ttcgggagaa caactcctcc 2520 
cgctgctggg tagcgctcac tcccacgctc gcggccagga acgctagcgt ccccactacg 2580 
acgatacgac gccatgtcga tttgctcgtt ggggcggctg ctctctgctc cgctatgtac 2640 
gtgggagatc tctgcggatc tgttttcctc gtcgcccagc tgttcacctt ctcgcctcgc 2700 
cggcacgaga cagtacagga otgcaattgc tcaatatatc ccggccacgt gacaggtcac 2760 
cgtatggctt gggatatgat gatgaactgg tcacctacag cagccctagt ggtatcgcag 2820 
ttactccgga tcccacaagc tgtcgtggat atggtggcgg gggcccattg gggagtccta 2880 
gcgggccttg cctactattc catggtgggg aactgggcta aggttctgat tgtgatgcta 2940 
ctctttgccg gcgttgacgg gggaacctat gtgacagggg ggacgatggc caaaaacacc 3000 
ctcgggatta cgtccctctt ttcacccggg tcatcccaga aaatccagct tgtaaacacc 3060 
aacggcagct ggcacatcaa caggactgcc ctgaactgca atgactccct caacactggg 3120 
ttccttgctg cgctgttcta cgtgcacaag ttcaactcat ctggatgccc agagcgcatg 3180 
gccagctgca gccccatcga cgcgttcgct caggggtggg ggcccatcac ttacaatgag 3240 
tcacacagct cggaccagag gccttattgt tggcactacg caccccggcc gtgcggtatc 3300 
gtacccgcgg cgcaggtgtg tggtccagtg tactgcttca ccccaagccc tgtcgtggtg 3360 
gggacgaccg accggttcgg cgtccotacg tacagttggg gggagaatga gacggacgtg 3420 
ctgcttctta acaacacgcg gccgccgcaa ggcaactggt ttggctgtac atggatgaat 3480 
agcactgggt tcaccaagac gtgcgggggc cccccgtgta acatcggggg gatcggcaat 3540 
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aaaaccttga cctgccccac ggactgcttc cggaagcacc ccgaggccac ttacaccaag 3600 

tgtggttcgg ggccttggtt gacacccaga tgcttggtcc actacccata caggctttgg 3660 

cactacccct gcactgtcaa ctttaccato ttcaaggtta ggatgtacgt ggggggagtg 3720 

gagcacaggc tcgaagccgc atgcaattgg actcgaggag agcgttgtaa cctggaggac 3780 

agggacagat cagagcttag cccgctgctg ctgtctacaa cggagtggca ggtattgccc 3840 

tgttccttca ccaccctacc ggctctgtcc aotggtttga tccatctcca tcagaacgtc 3900 

gtggacgtac aatacctgta cggtataggg tcggcggttg tctcctttgc aatcaaatgg 3960 

gagtatgtcc tgttgctctt ccttcttctg gcggacgcgc gcgtctgtgc ctgcttgtgg 4020 

atgatgctgc tgatagctca agctgaggcc gccctagaga acctggtggt cctcaacgcg 4080 

gcatccgtgg ccggggcgca tggcattctc tccttcctcg tgttcttctg tgctgcctgg 4140 

tacatcaagg gcaggctggt ccctggggcg gcatatgccc tctacggcgt atggccgcta 4200 

ctcctgctcc tgctggcgtt accaccacga gcatacgcca tggaccggga gatggcagca 4260 

tcgtgcggag gcgcggtttt cgtaggtctg atactcttga ccttgtcacc gcactataag 4320 

ctgttcctcg ctaggctcat atggtggtta caatatttta tcaccagggc cgaggcacac 4380 

ttgcaagtgt ggatcccccc cctcaacgtt cgggggggcc gcgatgccgt catcctcctc 4440 

acgtgcgcga tccacccaga gctaatcttt accatcacca aaatcttgct cgccatactc 4500 

ggtccactca tggtgctcca ggctggtata accaaagtgc cgtacttcgt gcgcgcacac 4560 

gggctcattc gtgcatgcat gctggtgcgg aaggttgctg ggggtcatta tgtccaaatg 4620 

gctctcatga agttggccgc actgacaggt acgtacgttt atgaccatct caccccactg 4680 

cgggactggg occacgcggg cctacgagac cttgcggtgg cagttgagcc cgtcgtcttc 4740 

tctgatatgg agaccaaggt tatcacctgg ggggcagaca ccgcggcgtg tggggacatc 4800 

atcttgggcc tgcccgtctc cgcccgcagg gggagggaga tacatctggg accggcagac 4860 

agccttgaag ggcaggggtg gcgactcctc gcgcctatta cggcctactc ccaacagacg 4920 

cgaggcctac ttggctgcat catcactagc ctcacaggcc gggacaggaa ccaggtcgag 4980 

ggggaggtcc aagtggtctc caccgcaaca caatctttcc tggcgacctg cgtcaatggc 5040 

gtgtgttgga ctgtctatca tggtgccggc tcaaagaccc ttgccggccc aaagggccca 5100 

atcacccaaa tgtacaccaa tgtggacoag gacctcgtcg gctggcaagc gccccccggg 5160 

gcgcgttcct tgacaccatg cacctgcggc agctcggacc tttacttggt cacgaggcat 5220 

gccgatgtca ttccggtgcg ccggcggggc gacagcaggg ggagcctact ctcccccagg 5280 

cccgtctcct acttgaaggg ctcttcgggc ggtccactgc tctgcccctc ggggcacgct 5340 

gtgggcatct ttcgggctgc cgtgtgcacc cgaggggttg cgaaggcggt ggactttgta 5400 

cccgtcgagt ctatggaaac cactatgcgg tccccggtct tcacggacaa ctcgtcccct 5460 

ccggccgtac cgcagacatt ccaggtggcc catctacacg cccctactgg tagcggcaag 5520 

agcactaagg tgccggctgc gtatgcagcc caagggtata aggtgcttgt cctgaacccg 5580 

tccgtcgccg ccaccctaqg tttcgggqcg tatatgtcta agqcacatgg tatcgaccct 5640 

aacatcagaa tcggggtaag gaccatcacc acgggtgccc ccatcacgta ctccacctat 5700 

ggcaagtttc ttgccgacgg tggttgctct gggggcgcct atgacatcat aatatgtgat 5760 

gagtgccact caactgactc gaccactatc ctgggcatcg gcacagtcct ggaccaagcg 5820 

gagacggctg gagcgcgact cgtcgtgctc gccaccgcta cgcctccggg atcggtcacc 5880 

gtgccacatc caaacatcga ggaggtggct ctgtccagca ctggagaaat ccccttttat 5940 

ggcaaagcca tccccatcga gaccatcaag ggggggaggc acctcatttt ctgccattcc 6000 

aagaagaaat gtgatgagct cgccgcgaag ctgtccggcc tcggactcaa tgctgtagca 6060 

tattaccggg gccttgatgt atccgtcata ccaactagcg gagacgtcat tgtcgtagca 6120 

acggacgccc taatgacggg ctttaccggt gacttcgact cagtgatcga ctgcaataca 6180 

tgtgtcaccc agacagtcga cttcagcctg gacccgacct tcaccattga gacgacgacc 6240 

gtgccacaag acgcggtgtr: acgct.cgcag cggngaggca ggactggtag gggcaggatg 6300 

ggcatttaca ggtttgtgac tccaggagaa cggccctcgg gcatgttcga ttcctcggtt 6360 

ctgtgcgagt gctatgacgc gggctgtgct tggtacgagc tcacgcccgc cgagacctca 6420 

gttaggttgc gggcttacct aaacacacca gggttgcccg tctgccagga ccatctggag 6480 

ttctgggaga gcgtctttac aggcctcacc cacatagacg cccatttctt gtcccagact 6540 

aagcaggcag gagacaactt cccctacctg gtagcatacc aggctacggt gtgcgccagg 6600 

gctcaggctc cacctccatc gtgggaccaa atgtggaagt gtctcatacg gctaaagcct 6660 

acgctgcacg ggccaacgcc cctgctgtat aggctgggag ccgttcaaaa cgaggttact 6720 

accacacacc ccataaccaa atacatcatg gcatgcatgt cggctgacct ggaggtcgtc 6780 

acgagcacct gggtgctggt aggcggagtc ctagcagctc tggccgcgta ttgcctgaca 6840 

acaggcagcg tggtcattgt gggcaggatc atcttgtccg gaaagccggc catcattccc 6900 

gacagggaag tcctttaccg ggagttcgat gagatggaag agtgcgcctc acacctccct 6960 

tacatcgaac agggaatgci gctcgccgaa caattcaaac agaaggcaat cgggttgctg 7020 

caaacagcca ccaagcaagc ggaggctgct gctcccgtgg tggaatccaa gtggcggacc 7080 

atcgaagcct tctgggcgaa gcatatgtgg aatttcatca gcgggataca atatttagca 7140 

ggcttgtcca ctctgcctgg caaccccgcg atagcatcac tgatggcatt cacagcctct 7200 

atcaccagcc cgctcaccac ccaacatacc ctcctgttta acatcctggg gggatgggtg 7260 

gccgcccaac ttgctcctcc cagcgctgct tctgctttcg taggcgccgg catcgctgga 7320 

gcggctgttg gcagcatagg ccttgggaag gtgcttgtgg atattttggc aggttatgga 7380 

gcaggggtgg caggcgcgct cgtggccttt aaggtcatga gcggcgagat gccctccacc 7440 

gaggacctgg ttaacctact ccctgctatc ctctcccctg gcgccctagt cgtcggggtc 7500 



54 



EP 1 043 399 A2 



gtgtgcgcag cgatactgcg tcggcacgtg ggcccagggg agggggctgt gcagtggatg 7560 

aaccggctga tagcgttcgc ttcgcggggt aaccacgtct cccccacgca ctatgtgcct 7620 

gagagcgacg ctgcagcacg tgtcactcag atcctctcta gtcttaccat cactcagctg 7680 

ctgaagaggc ttcaccagtg gatcaacgag gactgctcca cgccatgctc cggctcgtgg 7740 

ctaagagatg tttgggattg gatatgcacg gtgttgactg atttcaagac ctggctccag 7800 

tccaagctcc tgccgcgatt gccgggagtc cccttcttct catgtcaacg tgggtacaag 7860 

ggagtctggc ggggcgacgg catcatgcaa accacctgcc catgtggggc acagatcacc 7920 

ggacatgtga aaaacggttc catgaggatc gtggggccta ggacctgtag taacacgtgg 7980 

catggaacat tccccattaa cgcgtacacc acgggcccct gcacgccctc cccggcgcca 8040 

aattattcta gggcgctgtg gcgggtggct gctgaggagt acgtggaggt tacgcgggtg 8100 

ggggatttcc actacgtgac gggcatgacc actgacgacg taaagtgccc gtgtcaggtt 8160 

ccggcccccg aattcttcac agaagtggat ggggtgcggt tgcacaggta cgctccagcg 8220 

tgcaaacccc tcctacggga ggaggtcaca ttcctggtcg ggctcaatca atacctggtt 8280 

gggtcacagc tcccatgcga gcccgaaccg gatgtagcag tgctcacttc catgctcacc 8340 

gacccctccc acattacggc ggagacggct aagcgtaggc tggccagggg atctcctccc B400 

cccttggcca gctcatcagc tagccagctg tctgcgcctt ccttgaaggc aacatgcact 8460 

acccgtcatg actccccgga cgctgacctc atcgaggcca acctcctgtg gcggcaggag 8520 

atgggcggga acatcacccg cgtggagtca gaaaataagg tagtaatttt ggactctttc 8580 

gagccgctcc aagcggagga ggatgagagg gaagtatccg ttccggcgga gatcctgcgg 8640 

aggtccagga aattccctcg agcgatgccc atatgggcac gcccggatta caaccctcca 8700 

ctgttagagt cctggaagga ccoggactac gtccctccag tggtacacgg gtgtccattg 8760 

ccgcctgcca aggcccctcc gataccacct tcacggagga agaggacggt tgtcctgtca 8820 

gaatctaccg tgtcttctgc cttggcggag ctcgccacag agaccttcgg cagctccgaa 8880 

tcgtcggccg tcgacagcgg cacggcaacg gcctctcctg accagccctc cgacgacggc 8940 

gacgcgggat ccgacgttga gtcgtactcc tccatgcccc cccttgaggg ggagccgggg 9000 

gatcccgatc tcagcgacgg gtcttggtct accgtaagcg aggaggctag tgaggaogtc 9060 

gtctgctgct cgatgtccta cacatggaca ggogccctga tcacgccatg cgctgcggag 9120 

gaaaccaagc tgcccatcaa tgcactgagc aactctttgc tccgtcacca caacttggtc 9180 

tatgctacaa catctcgcag cgcaagcctg cggcagaaga aggtcacctt tgacagactg 9240 

caggtcctgg acgaccacta ccgggacgtg ctcaaggaga tgaaggcgaa ggcgtccaca 9300 

gttaaggcta aacttctatc cgtggaggaa gcctgtaagc tgacgccccc acattcggcc 9360 

agatctaaat ttggctatgg ggcaaaggac gtccggaacc tatccagcaa ggncgttaac 9420 

cacatccgct ccgtgtggaa ggacttgctg gaagacactg agacaccaat tgacaccacc 9480 

atcatggcaa aaaatgaggt tttctgcgtc caaccagaga aggggggccg caagccagct 9540 

cgccttatcg tattcccaga tttgggggtt cgtgtgtgcg agaaaatggc cctttaogat 9600 

gtggtctcca ccctccctca ggccgtgatg ggctcttcat acggattcca atactctcct 9660 

ggacagcggg tcgagttcct ggtgaatgcc tggaaagcga agaaatgccc tatgggcttc 9720 

gcatatgaca cccgctgttt tgactcaacg gtcactgaga atgacatccg tgttgaggag 9780 

tcaatctacc aatgttgtga cttggccccc gaagccagac aggccataag gtcgctcaca 9840 

gagcggcttt acatcggggg ccccctgact aattctaaag ggcagaactg cggctatcgc 9900 

cggtgccgcg cgagcggtgt actgacgacc agctgcggta ataccctcac atgttacttg 9960 

aaggccgctg cggcctgtcg agctgcgaag ctccaggact gcacgatgct cgtatgcgga 10020 

gacgaccttg tcgttatctg tgaaagcgcg gggacccaag aggacgaggc gagcctacgg 10080 

gccttcacgg aggctatgac tagatactct gccccccctg gggacccgcc caaaccagaa 10140 

tacgacttgg agttgataac atcatgctcc tccaatgtgt cagtcgcgca cgatgcatct 10200 

ggcaaaaggg tgtactatct cacccgtgac cccaccaccc cccttgcgcg ggctgcgtgg 10260 

gagacagcta gacacactcc agtcaattcc tggctaggca acatcatcat gtatgcgccc 10320 

accttgtggg caaggatgat cctgatgact catttcttct ccatccttct agctcaggaa 10380 

caacttgaaa aagccctaga ttgtcagatc tacggggcct gttactccat tgagccactt 10440 

gacctacctc agatcattca acgactccat ggccttagcg cattttcact ccatagttac 10500 

tctccaggtg agatcaatag ggtggcttca tgcctcagga aacttggggt accgcccttg 10560 

cgagtctgga gacatcgggc cagaagtgtc cgcgctaggc tactgtccca gggggggagg 10620 

gctgccactt gtggcaagta cctcttcaac tgggcagtaa ggaccaagct caaactcact 10680 

ccaatcccgg ctgcgtccca gttggattta tccagctggt tcgttgctgg ttacagcggg 10740 

ggagacatat atcacagcct gtctcgtgcc cgaccccgct ggttcatgtg gtgcctacto 10800 

ctactttctg taggggtagg catctatcta ctccccaacc gatgaacggg gagctaaaca 10860 

ctccaggcca ataggccatc ctgttttttt cccttttttt ttttcttttt tttttttttt 10920 

tttttttttt tttttttttc tccttttttt ttcctctttt tttccttttc tttcctttgg 10980 

tggctccatc ttagccctag tcacggctag ctgtgaaagg tccgtgagcc gcttgactgc 11040 
agagagtgct gatactggcc tctctgcaga tcaagt 11076 
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<210> 10 
<211> 8001 
<212> DNA 

<213> Hepatitis C Virus 
<400> 10 

gccagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactactg 60 
tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 
cccccctocc gggagagcca tagtggtctg eggaaccggt gagtacaccg gaattgccag 180 
gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccccc 240 
gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 
gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 
ctcaaagaaa aaccaaacgt aacaccaacg ggcgcgccat gattgaacaa gatggattgc 420 
acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 480 
caatcggctg ctctgatgcc gccgtgttcc ggctgtcagc gcaggggcgc ccggttcttt 540 
ttgtcaagac cgacctgtcc ggtgccctga atgaactgca ggacgaggca gcgcggctat 600 
cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 660 
gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 720 
ctcctgccga gaaagtatcc atcatggctg atgoaatgcg gcggctgcat acgcttgatc 780 
cggctacctg cccattcgac caccaagcga aaoatcgcat cgagcgagca cgtactcgga 840 
tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 900 
ccgaactgtt cgccaggctc aaggcgegca tgcccgacgg cgaggatctc gtcgtgaccc 960 
atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 1020 
actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 1080 
ttgctgaaga gcttggcggc gaatgggctg accgcttcct cgtgctttac ggtatcgccg 1140 
ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagtttaaa 1200 
cagaccacaa cggtttccct ctagcgggat caattccgcc cctctccctc ccccccccct 1260 
aacgttactg gocgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt 1320 
tccaecatat tgccgtcttt tggcaatgtg agggcocgga aacctggccc tgtcttcttg 1380 
acgagcattc ctaggggtot ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc 1440 
gtgaaggaag cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt 1500 
tgcaggcagc ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta 1560 
taagatacac ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg 1620 
gaaagagtca aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag 1680 
gtaccccatt gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag 1740 
tcgaggttaa aaaacgtcta ggccccccga accacgggga cgtggtttfcc ctttgaaaaa 1800 
cacgataata ccatggcgcc tattacggcc tactcccaac agacgcgagg cctacttggc 1860 
tgcatcatca otagcctcac aggccgggac aggaaccagg tcgaggggga ggtccaagtg 1920 
gtctccaccg caacacaatc tttcctggcg acctgcgtca atggcgtgtg ttggactgtc 1980 
tatcatggtg ccggctcaaa gacccttgcc ggcccaaagg gcccaatcac ccaaatgtac 2040 
accaatgtgg accaggacct cgtcggctgg caagcgcccc ccggggcgcg ttccttgaca 2100 
ccatgcacct gcggcagctc ggacctttac ttggtcacga ggcatgccga tgtcattccg 2160 
gtgcgccggc ggggcgacag cagggggagc ctactctccc ccaggcccgt ctcctacttg 2220 
aagggctctt cgggcggtcc actgctctgc ccctcggggc acgctgtggg catctttcgg 2280 
gctgccgtgt gcacccgagg ggttgcgaag gcggtggact ttgtacccgt cgagtctatg 2340 
ggaaccacta tgcggtcccc ggtcttcacg gacaactcgt cccctccggc cgtaccgcag 2400 
acattccagg tggcccatct acacgcccct actggtagcg gcaagagcac taaggtgccg 2460 
gctgcgtatg caggccaagg gtataaggtg cttgtcctga acccgtccgt cgccgccacc 2520 
ctaggtttcg gggcgtatat gtctaaggca catggtatcg accctaacat cagaatcggg 2580 
gtaaggacca tcaccacggg tgcccccatc acgtactcca cctatggcaa gtttcttgcc 2640 
gacggtggtt gotctggggg cgcctatgac atcataatat gtgatgagtg ccactcaact 2700 
gactcgacca ctatcctggg catcggcaca gtcctggacc aagcggagac ggctggagcg 2760 
cgactcgtcg tgctcgccac cgctacgcct ccgggatcgg tcaccgtgcc acatccaaac 2820 
atcgaggagg tggctctgtc cagcactgga gaaatcccct tttatggcaa agccatcccc 2880 
atcgagacca tcaagggggg gaggcacctc attttctgcc attccaagaa gaaatgtgat 2940 
gagctcgccg cgaagctgtc cggcctcgga ctcaatgctg tagcatatta ccggggcctt 3000 
gatgtatccg tcatacc-ac tagcggagac gtcattgtcg tagcaacgga cgctctaatg 3060 
acgggcttta ccggcgactt cgactcagtg atcgactgca atacatgtgt cacccagaca 3120 
gtcgacttca gcctggaccc gaccttcacc attgagacga cgaccgtgcc acaagacgcg 3180 
gtgtcacgct cgcagcggcg aggcaggact ggtaggggca ggatgggcat ttacaggttt 3240 
gtgactccag gagaacggcc ctcgggcatg ttcgattcct cggttctgtg cgagtgctat 3300 
gacgcgggct gtgcttggta cgagctcacg cccgccgaga cctcagttag gttgcgggct 3360 
tacctaaaca caccagggtt gcccgtctgc caggaocatc tggagttctg ggagagcgtc 3420 
tttacaggcc tcacccacat agacgcccat ttcttgtccc agactaagca ggcaggagac 3480 
aacttcccct acctggtagc ataccaggct acggtgtgcg ccagggctca ggctccacct 3540 
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ccatcgtggg accaaatgtg gaagtgtctc atacggctaa agcctacgct gcacgggcca 3600 
acgcccctgc tgtataggct gggagccgtt caaaacgagg ttactaccac acaccccata 3660 
accaaataca tcatggcatg catgtcggct gacctggagg tcgtcacgag cacctgggtg 3720 
ctggtaggcg gagtcctagc agctctggcc gcgtattgcc tgacaacagg cagcgtggtc 3780 
attgtgggca ggatcatctt gtccggaaag ccggccatca ttcccgacag ggaagtcctt 3840 
taccgggagt togatgagat ggaagagtgc gcctcacacc tcccttacat cgaacaggga 3900 
atgcagctcg ccgaacaatt caaacagaag gcaatcgggt tgctgcaaac agccaccaag 3960 
caagcggagg ctgctgctcc cgtggtggaa tccaagtggc ggaccatcga agccttctgg 4020 
gcgaagcata tgtggaattt catcagcggg atacaatatt tagcaggctt gtccactctg 4080 
cctggcaacc ccgcgatagc atcactgatg gcattcacag cctctatcac cagcccgctc 4140 
accacccaac ataccctcct gtttaacatc ctggggggat gggtggccgc ccaacttgct 4200 
cctcccagcg ctgcttctgc tttcgtaggc gccggcatcg ctggagcggc tgttggcagc 4260 
ataggccttg ggaaggtgct tgtggatatt ttggcaggtt atggagcagg ggtggcaggc 4320 
gcgctcgtgg cctttaaggt catgagoggc gagttgcact ccaccgagga cctggttaao 4380 
ctactccctg ctatcctctc ccctggcgcc ctagtcgtcg gggtcgtgtg egcagcgata 4440 
ctgcgtcggc acgtgggccc aggggagggg gctgtgcagt ggatgaaccg gctgatagcg 4500 
ttcgcttcgc ggggtaacca cgtctccccc acgcactatg tgcctgagag cgacgctgca 4560 
gcacgagtca ctcagatcct ctctagtctt accatcactc agctgctgaa gaggcttcac 4620 
cagtggatca acgaggactg ctccacgcca tgctccggct cgtggctaag agatgtttgg 4680 
gattggatat gcacggtgtt gactgatttc aagacctggc tccagtccaa gctcctgccg 4740 
cgattgcogg gagtccoott cttctcatgt caacgtgggt acaagggagt ctggcggggc 4 800 
gaoggcatca tgcaaaccac ctgcocatgt ggagcacaga tcaccggaca tgtgaaaaac 4860 
ggttccatga ggatcgtggg gcctaggacc tgtagtaaca cgtggcatgg aacattcccc 4920 
attaacgcgt acaccacggg cccctgcacg ccctccccgg cgccaaatta ttctagggcg 4980 
ctgtggcggg taggtgctga ggagtacgtg gaggttacgc gggtggggga tttccactac 5040 
gtgacgggca tgaccactga caacgtaaag tgcccgtgtc aggttccggc ccccgaattc 5100 
ttcacagaag tggatggggt goggttgcac aggtacgctc cagcgtgcaa acccctccta 5160 
cgggaggagg tcacattcct ggtcgggotc aatcaatacc tggttgggtc acagctccca 5220 
tgcgagcctg aaccggatgt agcagtgctc aottccatgc tcaccgaccc ctcccacatt 5280 
acggcggaga cggctaagcg taggctggcc aggggatctc cccccccctt ggccagctca 5340 
tcagctagcc agctgtctgc gccttccttg aaggcaacat gcactacccg tcatgactcc 5400 
ccggacgctg acctcatcga ggccaacctc ctgtggcggc aggagatggg cgggaacatc 5460 
acccgcgtgg agtcagaaaa taaggtagta attttggact ctttcgagcc gctccaagcg 5520 
gaggaggatg agaggggagt atccgttccg gcggagatcc tgcggaggtc caggaaattc 5580 
cctcgagcga tgcccatatg ggcacgcccg gattacaacc ctccactgtt agagtcctgg 5640 
aaggacccgg actacgtccc tccagtggta cacgggtgtc cattgccgcc tgccaaggcc 5700 
cctccgatac caccttcacg gaggaagagg acggttgtcc tgtcagaatc taccgtgtct 5760 
tctgccttgg cggagctcgc cacagagacc ttcggcagct ccgaatcgtc ggccgtcgac 5820 
agcggcacgg caacggcctc tcctgaccag cccf.ccgacg acggcgacgc gggatccgac 5880 
gttgagtcgt actcctccat gccccccctt gagggggagc cgggggatcc cgatctcagc 5940 
gacgggtctt ggtctaccgt aagcgaggag gctagtgagg acgtcgtctg ctgctcgatg 6000 
tcctacacat ggacaggcgc cctgatcacg ccatgcgctg cggaggaaac caagctgccc 6060 
atcaatgcac tgagcaactc tttgctccgt caccacaact tggtctatgc tacaacatct 6120 
cgcagcgcaa acctgcggca gaagaaggtc acctttgaca gactgcaggt cctggacgac 6180 
cactaccggg acgtgctcaa ggagatgaag gcgaaggcgt ccacagttaa ggctaaactt 6240 
ctatccgtgg aggaagcctg taagctgacg cccccacatt cggccagatc taaatttggc 6300 
tatggggcaa aggacgtccg gaacctatcc agcaaggccg ttaaccacat ccgctccgtg 6360 
tggaaggact tgctggaaga cactgagaca ccaattgaca ccaccatcat ggcaaaaaat 6420 
gaggttttct gcgtccaacc agagaagggg ggccgcaagc cagctcgcct tatcgtattc 6480 
ccagatttgg gggttcgtgt gtgcgagaaa atggcccttt acgatgtggt ctccaccctc 6540 
cctcaggccg tgatgggctc ttcatacgga ttccaatact ctcctggaca gcgggtcgag 6600 
ttcctggtga atgcctggaa agcgaagaaa tgccctatgg gcttcgcata tgacacccgc 6660 
tgttttgact caacggtcac tgagaatgac atccgtgttg aggagtcaat ctaccaatgt 6720 
tgtgacttgg cccccgaagc cagacaggcc ataaggtcgc tcacagagcg gctttacatc 6780 
gggggccccc tgactaattc taaagggcag aactgcggct atcgccggtg ccgcgcgagc 6840 
ggtgtactga cgaccagctg cggtaatacc ctcacatgtt acttgaaggc cgctgcggcc 6900 
tgtcgagctg cgaagctcca ggactgcacg atgctcgtat gcggagacga ccttgtcgtt 6960 
atctgtgaaa gcgcggggac ccaagaggac gaggcgagcc tacgggcctt cacggaggct 7020 
atgactagat actctgcccc ccctggggac ccgcccaaac cagaatacga cttggagttg 7080 
ataacatcat gctcctccaa tgtgtcagtc gcgcacgatg catctggcaa aagggtgtac 7140 
tatctcaccc gtgaccccac cacccccctt gcgcgggctg cgtgggagac agctagacac 7200 
actccagtca attcctggct aggoaacatc atcatgcatg cgcccacctt gtgggcaagg 7260 
atgatcctga tgactcattt cttctccatc cttctagctc aggaacaact tgaaaaagcc 7320 
ctagattgtc agatctacgg ggcctgttac tccattgagc cacttgacct acctcagatc 7380 
attcaacgac tccatggcct tagcgcattt tcactccata gttactctcc aggtgagatc 7440 
aatagggtgg cttcatgcct caggaaactt ggggtaccgc ccttgcgagt ctggagacat 7500 
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cgggccagaa gtgtccgcgc taggotactg 
aagtacctct tcaactgggc agtaaggacc 
tcccagttgg atttatccag ctggttcgtt 
agcctgtctc gtgcccgacc ccgctggttc 
gtaggcatct atctactccc caaccgatga 
ccatcctgtt tttttccctt tttttttttc 
ttttctcctt tttttttcct ctttttttcc 
cctagtcacg gctagctgtg aaaggtccgt 
tggcctctct gcagatcaag t 



tcccaggggg ggagggctgc cacttgtggc 7560 
aagctcaaac tcactccaat cccggctgcg 7620 
gctggttaca gcgggggaga catatatcac 7680 
atgtggtgcc tactcctact ttctgtaggg 7740 
acggggagct aaacactcca ggccaatagg 7800 
tttttttttt tttttttttt tttttttttt 7860 
ttttctttcc tttggtggct ccatcttagc 7920 
gagccgcttg actgcagaga gtgctgatac 7980 
8001 
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<210> 11 
<211> 11076 
<212> DNA 

g <213> Hepatitis C Virus 

<400> 11 

gccagccccc gattgggggc gacactccac catagatcac tcccctgtga ggaactactg 60 

tcttcacgca gaaagcgtct agccatggcg ttagtatgag tgtcgtgcag cctccaggac 120 

cccccctccc gggagagcca tagtggtctg cggaaccggt gagtacaccg gaattgccag 1B0 

gacgaccggg tcctttcttg gatcaacccg ctcaatgcct ggagatttgg gcgtgccccc 240 

10 gcgagactgc tagccgagta gtgttgggtc gcgaaaggcc ttgtggtact gcctgatagg 300 

gtgcttgcga gtgccccggg aggtctcgta gaccgtgcac catgagcacg aatcctaaac 360 

ctcaaagaaa aaccaaacgt aacaccaacg ggcgcgccat gattgaacaa gatggattgc 420 

acgcaggttc tccggccgct tgggtggaga ggctattcgg ctatgactgg gcacaacaga 480 

caatcggctg ctctgatgcc gcogtgttcc ggctgtcagc goaggggcgc ccggttcttt 540 

ttgtcaagac cgacctgtcc ggtgccctga atgaaotgca ggacgaggca gcgcggctat 600 

cgtggctggc cacgacgggc gttccttgcg cagctgtgct cgacgttgtc actgaagcgg 660 

gaagggactg gctgctattg ggcgaagtgc cggggcagga tctcctgtca tctcaccttg 720 

ctcctgccga gaaagtatcc atcatggctg atgcaatgcg gcggctgcat acgcttgatc 780 

cggctacctg cccattcgac caccaagcga aacatcgcat cgagcgagca cgtactcgga 840 

tggaagccgg tcttgtcgat caggatgatc tggacgaaga gcatcagggg ctcgcgccag 900 

ccgaactgtt cgccaggctc aaggcgcgca tgcccgacgg cgaggatctc gtcgtgaccc 960 

atggcgatgc ctgcttgccg aatatcatgg tggaaaatgg ccgcttttct ggattcatcg 1020 

20 actgtggccg gctgggtgtg gcggaccgct atcaggacat agcgttggct acccgtgata 1080 

ttgctgaaga gcttggoggo gaatgggctg accgcttcct cgtgctttac ggtatcgccg 1140 

ctcccgattc gcagcgcatc gccttctatc gccttcttga cgagttcttc tgagtttaaa 1200 

cagaccacaa cggtttccct ctagcgggat caattccgcc cctctccctc ccccccccct 1260 

aacgttactg gccgaagccg cttggaataa ggccggtgtg cgtttgtcta tatgttattt 1320 

tccaccatat tgccgtcttt tggcaatgtg agggcccgga aacctggccc tgtcttcttg 1380 

ss acgagcattc ctaggggtct ttcccctctc gccaaaggaa tgcaaggtct gttgaatgtc 1440 

gtgaaggaag cagttcctct ggaagcttct tgaagacaaa caacgtctgt agcgaccctt 1500 

tgcaggcagc ggaacccccc acctggcgac aggtgcctct gcggccaaaa gccacgtgta 1560 

taagatacac ctgcaaaggc ggcacaaccc cagtgccacg ttgtgagttg gatagttgtg 1620 

gaaagagtca aatggctctc ctcaagcgta ttcaacaagg ggctgaagga tgcccagaag 1680 

gtaccccatt gtatgggatc tgatctgggg cctcggtgca catgctttac atgtgtttag 1740 

tcgaggttaa aaaacgtcta ggccccccga accacgggga cgtggttttc ctttgaaaaa 1800 

30 oacgataata ccatgggcac gaatcctaaa cctcaaagaa aaaccaaacg taacaccaac 1860 

cgccgcccac aggacgtcaa gttcecgggc ggtggtcaga tcgtcggtgg agtttacctg 1920 

ttgccgcgca ggggccccag gttgggtgtg cgcgcgacta ggaagacttc cgagcggtcg 1980 

caacctcgtg gaaggcgaca acctatcccc aaggctcgcc agcccgaggg tagggcctgg 2040 

gctcagcccg ggtacccctg gcccctctat ggcaatgagg gcttggggtg ggcaggatgg 2100 

ctcctgtcac cccgtggctc tcggcctagt tggggcccca cggacccccg gcgtaggtcg 2160 

3 5 cgcaatttgg gtaaggtcat cgataccctc acgtgcggct tcgccgatct catggggtac 2220 

attccgctcg tcggcgcccc cctagggggc gctgccaggg ccctggcgca tggcgtccgg 22 B0 

gttctggagg acggcgtgaa ctatgcaaca gggaatctgc ccggttgctc cttttctatc 2340 

ttccttttgg ctttgctgtc ctgtttgacc atcccagctt ccgcttatga agtgcgcaac 2400 

gtatccggag tgtaccatgt cacgaacgac tgctccaacg caagcattgt gtatgaggoa 2460 

gcggacatga tcatgcatac ccccgggtgc gtgccctgcg ttcgggagaa caactcctcc 2520 

cgctgctggg tagcgctcac tcccacgctc gcggccagga acgctagcgt ccccactacg 2580 

40 acgatacgao gccatgtcga tttgctcgtt ggggcggctg ctctctgctc cgctatgtac 2640 

gtgggagatc tctgcggatc tgttttcctc gtcgcccagc tgttcacctt ctcgcctcgc 2700 

cggcacgaga cagtacagga ctgcaattgc tcaatatatc ccggccacgt gacaggtcac 2760 

cgtatggctt gggatatgat gatgaactgg tcacctacag cagccctagt ggtatcgcag 2820 

ttactccgga tcccacaagc tgtcgtggat atggtggcgg gggcccattg gggagtccta 2880 

gcgggccttg cctactattc catggtgggg aactgggcta aggttctgat tgtgatgcta 2940 

45 ctctttgccg gcgttgacgg gggaacctat gtgacagggg ggacgatggc caaaaacacc 3000 

ctcgggatta cgtccctctt ttcacccggg tcatcccaga aaatccagct tgtaaacacc 3060 

aacggcagct ggcacatcaa caggactgcc ctgaactgca atgactccct caacactggg 3120 

ttccttgctg cgctgttcta cgtgcacaag ttcaactcat ctggatgccc agagcgcatg 3180 

gccagctgca gccccatcga cgcgttcgct caggggtggg ggcccatcac ttacaatgag 3240 

tcacacagct cggaccagag gccttattgt tggcactacg caccccggcc gtgcggtatc 3300 

50 gtacccgcgg cgcaggtgtg tggtccagtg tactgcttca ccccaagccc tgtcgtggtg 3360 

gggacgaccg accggttcgg cgtccctacg tacagttggg gggagaatga gacggacgtg 3420 

ctgcttctta acaacacgcg gccgccgcaa ggcaactggt ttggctgtac atggatgaat 3480 

agcactgggt tcaccaagac gtgcgggggc cccccgtgta acatcggggg gatcggcaat 3540 
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aaaaccttga cctgccccac ggactgcttc cggaagcacc ccgaggccac ttacaccaag 3600 

tgtggttcgg ggccttggtt gacacccaga tgcttggtcc actacccata caggctttgg 3660 

cactacccct gcactgtcaa ctttaccatc ttcaaggtta ggatgtacgt ggggggagtg 3720 

gagcacaggc tcgaagccgc atgcaattgg actcgaggag agcgttgtaa cctggaggac 3780 

agggacagat cagagcttag cccgctgctg ctgtctacaa cggagtggca ggtattgccc 3840 

tgttccttca ccaccctacc ggctctgtcc aotggtttga tocatctcca tcagaacgtc 3900 

gtggacgtac aatacctgta cggtataggg tcggcggttg tctccttcgc aatcaaatgg 3960 

gagtatgtcc tgttgctctt ccttcttctg gcggacgcgc gcgtctgtgc ctgcttgtgg 4020 

atgatgctgc tgatagctca agctgaggcc gccctagaga acctggtggt cctcaacgcg 4080 

gcatccgtgg ccggggcgca tggcattctc tccttcctcg tgttcttctg tgctgcctgg 4140 

tacatcaagg gcaggctggt ccctggggcg gcatatgccc tctacggcgt atggccgcta 4200 

ctcctgctcc tgctggcgtt accaccacga gcatacgcca tggaccggga gatggcagca 4260 

tcgtgcggag gcgcggtttt cgtaggtctg atactcttga ccttgtcacc gcactataag 4320 

ctgttcctcg ctaggctcat atggtggtta caatatttta tcaccagggc cgaggcacac 4380 

ttgcaagtgt ggatcccccc cctcaacgtt cgggggggcc gcgatgccgt catcctcctc 4440 

acgtgcgcga tccacccaga gctaatcttt accatcacca aaatcttgct cgccatactc 4500 

ggtccactca tggtgctcca ggctggtata accaaagtgc cgtacttcgt gcgcgcacac 4560 

gggctcattc gtgcatgcat gctggtgcgg aaggttgctg ggggtcatta tgtccaaatg 4620 

gctctcatga agttggccgc actgacaggt acgtacgttt atgaccatct caccccactg 4680 

cgggactggg cccacgcggg cctacgagac cttgcggtgg cagttgagcc cgtcgtcttc 4740 

tctgatatgg agaccaaggt tatcacctgg ggggcagaca ccgcggcgtg tggggacatc 4800 

atcttgggcc tgcccgtctc ogcocgcagg gggagggaga tacatctggg accggcagac 4860 

agccttgaag ggcaggggtg gcgactcctc gcgcctatta cggcctactc ccaacagacg 4920 

cgaggcctac ttggctgcat catcactagc ctcacaggcc gggacaggaa ccaggtcgag 4980 

ggggaggtcc aagtggtctc caccgcaaca caatctttcc tggcgacctg cgtcaatggc 5040 

gtgtgttgga ctgtctatca tggtgccggc tcaaagaccc ttgccggccc aaagggccca 5100 

atcacccaaa tgtacaccaa tgtggaccag gacctcgtcg gctggcaagc gccccccggg 5160 

gcgcgttcot tgacacoatg cacotgcggc agctcggacc tttacttggt cacgaggcat 5220 

gccgatgtca ttccggtgcg ccggcggggc gacagcaggg ggagcctact ctcccccagg 5280 

cccgtctcct acttgaaggg ctcttcgggc ggtccactgc tctgcccctc ggggcacgct 5340 

gtgggcatct ttcgggctgc cgtgtgcacc cgaggggttg cgaaggcggt ggactttgta 5400 

cccgtcgagt ctatgggaac cactatgcgg tccccggtct tcacggacaa ctcgtcccct 5460 

ccggccgtac cgcagacatt ccaggtggcc catctacacg cccctactgg tagcggcaag 5520 

agcactaagg tgccggctgc gtatgcaggc caagggtata aggtgcttgt cctgaacccg 5580 

tccgtcgccg ccaccctagg tttcggggcg tatatgtcta aggcacatgg tatcgaccct 5640 

aacatcagaa tcggggtaag gaccatcacc acgggtgccc ccatcacgta ctccacctat 5700 

ggcaagtttc ttgccgacgg tggttgctct gggggcgcct atgacatcat aatatgtgat 5760 

gagtgccact caactgactc gaccactatc ctgggcatcg gcacagtcct ggaccaagcg 5820 

gagacggctg gagcgcgact cgtcgtgctc gccaccgcta cgcctccggg atcggtcacc 5880 

gtgccacatc caaacatcga ggaggtggct ctgtccagca ctggagaaat ccccttttat 5940 

ggcaaagcca tccccatcga gaccatcaag ggggggaggc acctcatttt ctgccattcc 6000 

aagaagaaat gtgatgagct cgccgcgaag ctgtccggcc tcggactcaa tgctgtagca 6060 

tattaccggg gccttgatgt atccgtcata ccaactagcg gagacgtcat tgtcgtagca 6120 

acggacgctc taatgacggg ctttaccggc gacttcgact cagtgatcga ctgcaataca 6180 

tgtgtcaccc agacagtcga cttcagcctg gacccgacct tcaccattga gacgacgacc 6240 

gtgccacaag acgcggtgtc acgctcgcag cggcgaggca ggactggtag gggcaggatg 6300 

ggcatttaca ggtttgtgac tccaggagaa cggccctcgg gcatgttcga ttcctcggtt 6360 

ctgtgcgagt gctatgacgc gggctgtgct tggtacgagc tcacgcccgc cgagacctca 6420 

gttaggttgc gggcttacct aaacacacca gggttgcccg tctgccagga ccatctggag 6480 

ttctgggaga gcgtctttac aggcctcacc cacatagacg cccatttctt gtcccagact 6540 

aagcaggcag gagaoaactt cccctacctg gtagcatacc aggctacggt gtgcgccagg 6600 

gctcaggctc cacctccatc gtgggaccaa atgtggaagt gtctcatacg gctaaagcct 6660 

acgctgcacg ggocaacgcc cctgctgtat aggctgggag ccgttcaaaa cgaggttact 6720 

accacacacc ccataaccaa atacatcatg gcatgcatgt cggctgacct ggaggtcgtc 6780 

acgagcacct gggtgctggt aggcggagtc ctagcagctc tggccgcgta ttgcctgaca 684 0 

acaggcagcg tggtcattgt gggcaggatc atcttgtccg gaaagccggc catcattccc 6900 

gacagggaag tcctttaccg ggagttcgat gagatggaag agtgcgcctc acacctccct 6960 

tacatcgaac agggaatg<-a gctcgccgaa caattcaaac agaaggcaat cgggttgctg 7020 

caaacagcca ccaagcaagc ggaggctgct gctcccgtgg tggaatccaa gtggcggacc 7080 

atcgaagcct tctgggcgaa gcatatgtgg aatttcatca gcgggataca atatttagca 7140 

ggcttgtcca ctctgcctgg caaccccgcg atagcatcac tgatggcatt cacagcctct 7200 

atcaccagcc cgctcaccac ccaacatacc ctcctgttta acatcctggg gggatgggtg 7260 

gccgcccaac ttgctcctcc cagcgctgct tctgctttcg taggcgccgg catcgctgga 7320 

gcggctgttg gcagcatagg ccttgggaag gtgcttgtgg atattttggc aggttatgga 7380 

gcaggggtgg caggcgcgct cgtggccttt aaggtcatga gcggcgagtt gccctccacc 7440 

gaggacctgg ttaacctact ccctgctatc ctctcccctg gcgccctagt cgtcggggtc 7500 
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gtgtgcgcag cgatactgcg Ccggcacgtg 
aaccggctga tagcgttcgc ttcgcggggt 
gagagcgacg ctgcagcacg agtcactcag 
ctgaagaggc ttcaccagtg gatcaacgag 
ctaagagatg tttgggattg gatatgcacg 
tccaagctcc tgccgcgatt gccgggagtc 
ggagtctggc ggggcgacgg catcatgcaa 
ggacatgtga aaaacggttc catgaggatc 
catggaacat tccccattaa cgcgtacacc 
aattattcta gggcgctgtg gcgggtaggt 
ggggatttcc actacgtgac gggcatgacc 
ccggcccccg aattcttcac agaagtggat 
tgcaaacccc tcctacggga ggaggtcaca 
gggtcacagc tcccatgcga gcctgaaccg 
gacccctccc acattacggc ggagacggct 
cccttggcca gctcatcagc tagccagctg 
acccgtcatg actccccgga cgctgacctc 
atgggcggga acatcacccg cgtggagtca 
gagccgctcc aagcggagga ggatgagagg 
aggtccagga aattccctcg agcgatgccc 
ctgttagagt cctggaagga cccggactac 
ccgcctgcca aggcccctcc gataccacct 
gaatctaccg tgtcttctgc cttggcggag 
tcgtcggccg tcgacagcgg cacggcaacg 
gacgcgggat ccgacgttga gtcgtactcc 
gatcccgatc tcagcgacgg gtcttggtct 
gtctgctgct cgatgtccta cacatggaca 
gaaaccaagc tgcccatcaa tgcactgagc 
tatgctacaa catctcgcag cgcaaacctg 
caggtcotgg acgaccacta ccgggacgtg 
gttaaggcta aacttctatc cgtggaggaa 
agatctaaat ttggctatgg ggcaaaggac 
cacatccgct ccgtgtggaa ggacttgctg 
atcatggcaa aaaatgaggt tttctgcgtc 
cgccttatcg tattcccaga tttgggggtt 
gtggtctcca ccctccctca ggccgtgatg 
ggacagcggg tcgagttcct ggtgaatgcc 
gcatatgaca cccgctgttt tgactcaacg 
tcaatctacc aatgttgtga cttggccccc 
gagcggcttt acatcggggg ccccctgact 
cggtgccgcg cgagcggtgt actgacgacc 
aaggccgctg cggcctgtcg agctgcgaag 
gacgaccttg tcgttatctg tgaaagcgcg 
gocttcacgg aggctatgac tagatactct 
tacgacttgg agttgataac atcatgctcc 
ggcaaaaggg tgtactatct cacccgtgac 
gagacagcta gacacactcc agtcaattcc 
accttgtggg caaggatgat cctgatgact 
caacttgaaa aagccctaga ttgtcagatc 
gacctacctc agatcattca acgactccat 
tctccaggtg agatcaatag ggtggcttca 
cgagtctgga gacatcgggc cagaagtgtc 
gctgccactt gtggcaagta cctcttcaac 
ccaatcccgg ctgcgtccca gttggattta 
ggagacatat atcacagcct gtctcgtgcc 
ctactttctg taggggtagg catctatcta 
ctccaggcca ataggccatc ctgttttttt 
tttttttttt tttttttttc tccttttttt 
tggctccatc ttagccctag tcacggctag 
agagagtgct gatactggcc tctctgcaga 



ggcccagggg agggggctgt gcagtggatg 7560 
aaccacgtct cccccacgca ctatgtgcct 7620 
atcctctcta gtcttaccat cactcagctg 7680 
gactgctcca cgccatgctc cggctcgtgg 7740 
gtgttgactg atttcaagac ctggctccag 7800 
cccttcttct catgtcaacg tgggtacaag 7860 
accacctgcc catgtggagc acagatcacc 7920 
gtggggccta ggacctgtag taacacgtgg 7980 
acgggcccct gcacgccctc cccggcgcca 8040 
gctgaggagt acgtggaggt tacgcgggtg 8100 
actgacaacg taaagtgccc gtgtcaggtt 8160 
ggggtgcggt tgcacaggta cgctccagcg 8220 
ttcctggtcg ggctcaatca atacctggtt 8280 
gatgtagcag tgctcacttc catgctcacc 8340 
aagcgtaggc tggccagggg atctcccccc 8400 
tctgcgoctt ccttgaaggc aacatgcact 8460 
atcgaggcca acctcctgtg gcggcaggag 8520 
gaaaataagg tagtaatttt ggactctttc 8580 
ggagtatccg ttccggcgga gatcctgcgg 8640 
atatgggcac gcccggatta caaccctcca 8700 
gtccctccag tggtacacgg gtgtccattg 8760 
tcacggagga agaggacggt tgtcctgtca 8820 
ctcgccacag agaccttcgg cagctccgaa 8880 
gcctctcctg accagccctc cgacgacggc 8940 
tccatgcccc cccttgaggg ggagccgggg 9000 
accgtaagcg aggaggctag tgaggacgtc 9060 
ggcgccctga tcacgccatg cgctgcggag 9120 
aactctttgc tccgtcacca caacttggtc 9180 
cggcagaaga aggtcacctt tgacagactg 9240 
ctcaaggaga tgaaggcgaa ggcgtccaca 9300 
gcctgtaagc tgacgccccc acattcggcc 9360 
gtccggaacc tatccagcaa ggccgttaac 9420 
gaagacactg agacaccaat tgacaccacc 9480 
caaccagaga aggggggccg caagccagct 9540 
cgtgtgtgcg agaaaatggc cctttacgat 9600 
ggctcttcat acggattcca atactctcct 9660 
tggaaagcga agaaatgccc Catgggcttc 9720 
gtcactgaga atgacatccg tgttgaggag 9780 
gaagccagac aggccataag gtcgctcaca 9840 
aattctaaag ggcagaactg cggctatcgc 9900 
agctgcggta ataccctcac atgttacttg 9960 
ctccaggact gcacgatgct cgtatgcgga 10020 
gggacccaag aggacgaggc gagcctacgg 10080 
gccccccctg gggacccgcc caaaccagaa 10140 
tccaatgtgt cagtcgcgca cgatgcatct 10200 
cccaccaccc cccttgcgcg ggctgcgtgg 10260 
tggctaggca acatcatcat gtatgcgccc 10320 
catttcttct ccatccttct agctcaggaa 10380 
tacggggcct gttactccat tgagccactt 10440 
ggccttagcg cattttcact ccatagttac 10500 
tgcctcagga aacttggggt accgcccttg 10560 
cgcgctaggc tactgtccca gggggggagg 10620 
tgggcagtaa ggaccaagct caaactcact 10680 
tccagctggt tcgttgctgg ttacagcggg 10740 
cgaccccgct ggttcatgtg gtgcctactc 10800 
ctccccaacc gatgaacggg gagctaaaca 10860 
cccttttttt ttttcttttt tttttttttt 10920 
ttcctctttt tttccttttc tttcctttgg 10980 
ctgtgaaagg tccgtgagcc gcttgactgc 11040 
tcaagt " 11076 
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Patentanspruche 

1 . Hepatitis C Virus (HCV) Zellkultursystem, das im wesentlichen eukaryontische Zellen umfaBt, die eingeschleustes 
HCV-spezifisches Genmaterial enthalten , dadurch gekennzeichnet, 

da(3 die eukaryontischen Zellen humane Hepatomazellen sind und daB das eingeschleuste HCV-spezifische 
Genmaterial ein HCV-RNA-Konstrukt ist, das die HCV-spezifischen RNA-Abschnitte 5' NTR, NS3, NS4A, 
NS4B, NS5A, NS5B und 3' NTR und zusatzlich ein selektierbares Markergen (Selektionsgen) umfaBt. 

2. Zellkultursystem nach Anspruch 1 , dadurch gekennzeichnet, 

daB die Hepatomazellen von einer handelsiiblichen Hepatomazellinie abstammen . 

3. Zellkultursystem nach Anspruch 1 , dadurch gekennzeichnet, 

daB die Hepatomazellen aus einer Hepatomaprimarzellkultur gewonnen sind. 

4. HCV-RNA-Konstrukt, dadurch gekennzeichnet, 

daB es die HCV-spezifischen RNA-Abschnitte 5' NTR, NS3, NS4A, NS4B, NS5A, NS5B und 3' NTR und 
zusatzlich ein selektierbares Markergen (Selektionsgen) umfaBt. 

5. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, 

dal3 es eine Nukleotidsequenz gemaB einem der Sequenzprotokolle SEQ ID NO: 1 bis SEQ ID NO: 1 1 umfaBt. 

6. HCV-RNA-Konstrukt nach Anspruch 4, dadurch gekennzeichnet, 

daB die 3' NTR eine Nukleotidsequenz aufweist, die aus der Gruppe der nachfolgend aufgelisteten Nukleotid- 
sequenzen (a) bis (i) ausgewahlt ist: 

(a) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTTTTT 
TTAGCTTTTTTTTTTTTCTTTTTTTTTGAGAGAGAGAGTCTCACTCTG 
TTGCCCAGACTGGAGT 
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(b) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTC TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GGAGC 

(c) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTAATCTTT TTTTTTTTCT TTTTTTTTGA GAGAGAGAGT 
CTCACTCTGT TGCCCAGACT GCAGC 

(d) ACC<K}GAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAGTC TTTTTTTTTT TCTTTTTTTT TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(e) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT jitttttxtx TCTTTTTTTT TGAGAGAGAG 
AGTCTCACTC TGTTGCCCAG ACTGGAGT 

(f) ACC<KXiAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT TCTTTTTTTT TTGAGAGAGA 
GAGTCTCACT CTGTTGCCCA GACTGGAGT 

(g) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTAGTCT TTTTTTTTTT CTTTTTTTTT GAGAGAGAGA 
GTCTCACTCT GTTGCCCAGA CTGGAGT 

(h) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTTAAT CTTTTTTTTT TTTTTCCTTT TTTTGAGAGA 
GAGAGTCTCA CTCTGTTGCC CAGACTGGAG T 

(i) ACGGGGAGCTAAACACTCCAGGCCAATAGGCCATCCTGTTTTTT 
TTTTTTAATC TTTTTTTTTT TTTTCTTTTT TTTTTGAGAG 
AGAGAGTCTC ACTCTGTTGC CCAGACTGGA GT 



7. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 6, dadurch gekennzeichnet, 

daB das selektierbare Markergen ein Resistenzgen und insbesondere eine Antibiotikaresistenzgen ist. 
so 8. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 6, dadurch gekennzeichnet, 
daB das selektierbare Markergen ein Neomycinphosphotransferasegen ist. 

9. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 8, dadurch gekennzeichnet, 
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daB das selektierbare Markergen strangabwarts der 5' NTR in die HCV-RNA integriert ist. 

10. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 9, dadurch gekennzeichnet, 
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daB das selektierbare Markergen uber ein Ribozym bzw. eine Erkennungsstelle fur ein Ribozym mit der HCV- 
RNA verbunden ist. 

11. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 10, dadurch gekennzeichnet, 

da(3 es ein integriertes Reportergen aufweist. 

12. HCV-RNA-Konstrukt nach Anspruch 1 1 , dadurch gekennzeichnet, 

da(3 das Reportergen ein Gen aus der Gruppe der Luziferasegene, dem CAT-Gen (Chloramphenicol-Acetayl- 
Transferase-Gen), dem lacZ-Gen (beta-Galaktosidasegen), der GFP-Gene (green-fluorescence-protein-Gene 
), dem GUS-Gen (Glukuronidasegen) und dem SEAP-Gen (Sezernierte-Alkalische-Phosphatase-Gen) ist. 

13. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 1 1, dadurch gekennzeichnet, 

daB deren Replikation die Expression eines (zellularen) Surrogatmarkergens beeinfluBt. 

14. HCV-RNA-Konstrukt nach einem der Anspruche 1 1 bis 13, dadurch gekennzeichnet, 

daB das Resistenzgen derart in das offene Leseraster der HCV-RNA einWoniert ist, daB es erst nach einer pro- 
teolytischen Prozessierung in eine aktive Form uberfuhrbar ist. 

15. HCV-RNA-Konstrukt nach einem der Anspruche 1 1 bis 14, dadurch gekennzeichnet, 

da(3 das Reportergen und das selektierbare Markergen derart raumlich in dem Konstrukt angeordnet sind, daB 
sie gemeinsam ein Fusionsprotein exprimieren. 

16. Zellkultursystem nach einem der Anspruche 1 bis 3 dadurch gekennzeichnet, 

da(3 das HCV-RNA-Konstrukt ein Konstrukt gemaB wenigstens einem der Anspruche 4 bis 15 ist. 

17. Zellkultursystem nach Anspruch 1, dadurch gekennzeichnet, 

daB die das HCV-RNA-Konstrukt enthaltenden Zellen bei der DSMZ, Braunschweig, BRD, unterder Hinterle- 
gungsnummer DSM ACC2394 (Laborbezeichnung HuBI 9-13) hinterlegt sind. 

18. Verwendung eines Zellkultursystems nach einem der Anspruche 1 bis 3 Oder 16 bis 1 7 und/oder eines HCV-RNA- 
Konstrukts nach einem der Anspruche 4 bis 15 zur Herstellung und/oder Evaluierung und/oder Testung von The- 
rapeutika und/oder Diagnostika zur Behandlung von insbesondere HCV-lnfektionen. 

19. Verwendung eines Zellkultursystems nach einem der Anspruche 1 bis 3 Oder 16 bis 17 und/oder eines HCV-RNA- 
Konstrukts nach einem der Anspruche 4 bis 15 zur Herstellung eines Impfstotfes gegen HCV-lnfektionen. 

20. Verwendung eines HCV-RNA-Konstrukts nach einem der Anspruche 4 bis 15 zur Herstellung einer leberzellspezi- 
f ischen Genfahre fur die Gentherapie . 

21. HCV-RNA-Konstrukt nach einem der Anspruche 4 bis 15, dadurch gekennzeichnet, 

daB es ein integriertes Fremdgen aufweist und dazu geeignet ist, dieses Fremdgen in eine Zielzelle einzu- 
schleusen, die zur Expression dieses Fremdgens geeignet ist. 

22. Verfahren zur Gewinnung von zellkultur-adaptierten Mutanten eines HCV-RNA-Konstrukts gemaB einem der 
Anspruche 4 bis 15, wobei die Mutanten gegeniiberdem HCV-RNA-Konstrukt eine erhohte Replikationseffizienz 
aufweisen, dadurch gekennzeichnet, 

daB man ein Zellkultursystem gemaB Anspruch 1 , bei dem das eingeschleuste HCV-spezifische Genmaterial 
ein HCV-RNA-Konstrukt mit Selektionsgen nach einem der Anspruche 4 bis 15 ist, auf/indem dem Selektions- 
gen entsprechenden Selektionsmedium kultiviert, daB man die gewachsenen Zellklone erntet, und daB man 
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aus diesen Zellklonen die HCV-RNA-Konstrukte Oder Teiledavon isoliert. 

23. Verfahren nach Anspruch 22, dadurch gekennzeichnet, 

daB man die isolierten HCV-RNA-Konstrukte wenigstens einmal erneut passagiert, namlich in Zellen eines 
Zellkultursystems nach Anspruch 1 einschleust, dasdabei erhaltene Zellkultursystem gemaB Anspruch 1, bei 
dem das eingeschleuste HCV-spezifische Genmaterial das isolierte HCV-RNA-Konstrukt mit Selektionsgen 
ist, auf/in dem dem Selektionsgen entsprechenden Selektionsmedium kultiviert, die gewachsenen ZellWone 
erntet und aus diesen Zellklonen die HCV-RNA-Konstrukte isoliert. 

24. Verfahren zur Herstellung von Mutanten eines HCV-Vollangengenoms oder eines HCV-Teilgenoms Oder eines 
beliebigen HCV- Konstrukts mit im Vergleich zu dem ursprunglichen HCV-Vollangengenom oder -Teilgenom oder 
HCV-RNA-Konstrukt erhohter Replikationseffizienz, dadurch gekennzeichnet, 

daB man mit einem Verfahren nach Anspruch 22 oder 23 eine zellkultur-adaptierte Mutante eines HCV-RNA- 
Konstrukts herstellt und isoliert, 

daB man die Nukleotid- und Aminosauresequenz dieser Mutante bestimmt und durch Vergleich mit der 
Nukleotid- und Aminosauresequenz des ursprunglichen HCV-RNA-Konstrukts die Art, Anzahl und Positionen 
der Nukleotid- und Aminosauremutationen bestimmt, 

und daB man diese Mutationen entweder durch gezielte Mutagenese Oder durch Austausch von Sequenzab- 
schnitten, die die betreffenden Mutationen enthalten, in ein (isoliertes) HCV- Vollangengenom oder ein HCV- 
Teilgenom oder ein beliebiges HCV-RNA-Konstrukt einfuhrt. 

25. Zellkultur-adaptiertes HCV-RNA-Konstrukt mit hoher Replikationseffizienz, dadurch gekennzeichnet, 

daB es durch Nukleotid- und/oder Aminosaure -Mutationen von einem HCV-RNA-Konstrukt nach einem der 
AnsprCiche 4 bis 1 5 ableitbar ist und daB es mit einem Verfahren nach einem der Anspruche 22 bis 24 erhaltlich 
ist. 

26. Zellkultur-adaptiertes HCV-RNA-Konstrukt nach Anspruch 25, dadurch gekennzeichnet, 

daB es einen oder mehrere der nachfolgend aufgefuhrten Aminosaureaustausche aufweist, namlich 1283 arg 
-> gly und/oder 1383 glu -> ala und/oder 1577 lys -> arg und/oder 1609 lys -> glu und/oder 1936 pro -> ser 
und/oder 2163 glu -> gly und/oder 2330 lys -> glu und/oder 2442 ile -> val aufweist. 

27. Zellkultur-adaptiertes HCV-RNA-Konstrukt nach Anspruch 25 oder 26, dadurch gekennzeichnet, 

daB es einen oder mehrere der in Tabelle 3 aufgefuhrten Nukleotid- und/oder Aminosaureaustausche auf- 
weist, wobei Tabelle 3 Bestandteil dieses Anspruchs ist. 

28. Zellkultur-adaptierte Mutanten eines HCV-RNA-Konstrukts oder eines HCV-Vollangengenoms mit im Vergleich zu 
dem ursprunglichen HCV-RNA-Konstrukt oder dem ursprunglichen HCV-Vollangengenom erhohter Replikationsef- 
fizienz , dadurch gekennzeichnet, 

daB sie mit einem Verfahren erhaltlich ist, bei dem man in einem zellkultur-adaptierten HCV-RNA-Konstrukt 
nach Anspruch 24 durch Sequenzanalyse und Sequenzvergleich die Art und Anzahl der Mutationen bestimmt 
und diese Mutationen in ein HCV-RNA-Konstrukt, insbesondere in ein HCV-RNA-Konstrukt gemaB einem der 
Anspruche 4 bis 15, oder in ein (isoliertes) HCV-RNA-Vollangengenom einfuhrt, entweder durch gezielte Muta- 
genese oder durch Austausch von Sequenzabschnitten, die die betreffenden Mutationen enthalten. 

29. Hepatitis C Viruspartikel oder virus-ahnliche Partikel dadurch gekennzeichnet, 

daB sie mit einem Verfahren nach einem der Anspruche 22-24 erhaltlich sind. 

30. Zellen, infiziert mit Hepatitis C Viruspartikeln oder virus-ahnliche Partikeln gemaB Anspruch 29. 
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Fig. 4 
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(Etkennungssequenz) 
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In vitro Transkript von klonierter HCV-RNA 

S'-T^T ^ 3 M 48I SA I SB { -3' 



Bestimmung der Molekulzahl 
(OD260 nm) 



G418-resistente 
Kolonien 



Preparation der 
Gesamtzell-RNA aus 
Einzelkolonie 



Gesamt-RNA aus 
naiven Huh-7 Zellen 



Bestimmung der Zahl der HCV-RNA Molekule 
(Northern Blot) 



Gesamtzell-RNA mit bekannter Zahl an HCV-RNA Molekulen 

+ CMV-Luziferase Plasmid (T ransfektionskontrolle) 
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Fig. 9 
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M 5.1 Oder 9-1 3F -Mutante 
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Fig. 12 
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